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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是： 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎,他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 



往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 ：如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉肌分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作,在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课（事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课）。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” （Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归 
模型、多维列联表的对数线性和对数乘积模型、有关删节 
数据的模型、纵贯数据的分析模型，包括追踪研究和事件 
史的分析方法。这些模型在社会科学研究中有着更加广 
泛的应用。 

修读过这些课程的香港科技大学的研究生，一直鼓励和 
支持我将两门课的讲稿结集出版，并帮助我将原来的英文课 
程讲稿译成了中文。但是，由于种种原因，这两本书拖了四 
年多还没有完成。世界著名的出版社 SAGE 的“定量社会科 
学研究”丛书闻名遐迩，每本书都写得通俗易懂。中山大学 
马骏教授向格致出版社何元龙社长推荐了这套书，当格致出 
版社向我提出从这套丛书中精选一批翻译，以飨中文读者 
时,我非常支持这个想法，因为这从某种程度上弥补了我的 
教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫锡炜；中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛； 美国加州大学 
洛杉肌分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



40 年来，经典的线性回归模型一直是社会科学定量研究 
方法论中重要的组成部分。目前已有的关于定量方法应用 
的书籍，涉及许多关于线性回归的各种延伸话题，例如 logit 、 
probit 、 事件史、广义线性、广义非参数模型和处理删截、样本 
选择、截断和缺失数据的线性回归 模型; 此外，还包括许多其 
他相关的模型，例如方差分析、协方差分析、因果模型、对数 
线性模型、多重比较和时间序列分析等。 

经典回归的主旨在于基于解释变量来估计因变量的均 
值。当回归假设成立时,这一方法是有 效的； 但当出现非标 
准情况时，它就会失效（关于线性回归假设的详细讨论，见 
《理解回归假设 》, William Berry 著）。其中两个是正态性假 
设和方差齐性假设。通常的社会科学数据无法满足这两个 
关键的假设。例如，（条件）收人分布一般不是正态的，并且 
首席执行官的年度分红分布随着公司规模的增大而上升，这 
意味着存在异方差性问题。这正是分位数回归可以处理的 
问题，因为它放松了这些假设。另外，分位数回归为研究者 
提供了一个(无法从经典回归中获得的）新视角，研究解释变 
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量对因变量分布中位置、尺度和形状的效应。 

分位数回归的思想并不新颖，事实上它起源于1760年， 
当时一个游历学者、克罗地亚基督徒 Rudjer Josip Boscov - 
ich -他拥有许多头 衔：物 理学家、天文学家、外交官、哲学 
家、诗人和数学家——来到伦敦讲授他尚未成熟的中位数回 
归方法。然而，这一回归方法计算的复杂性直到最近依然是 
一大挑战。由于今日快速的计算功能和统计软件的广泛应 
用（如可执行分位数回归程序的 R 、 SAS 和 Stata )， 使得拟合 
分位数回归模型变得更加容易。但是，至今我们仍未提供任 
何关于分位数回归是什么的 介绍。 在本书中， Hao 和 Naim - 
an 提出了分位数和分位数函数的概念，并阐述了分位数回归 
模型，讨论了它们的估计和推断方法，并通过具体例子演示 
了对分位数回归估计值(是否转换）的解释。同时，他们也提 
供了应用分位数回归分析美国1991年和2001年收入不平 
等的完整例子，以此确定这一方法的思想和步骤。本书填补 
了丛书的空白并且有助于社会科学研究者更加熟悉分位数 
回归。 


摩■福挺 
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回归分析的目的在于揭示因变量和自变量的关系。在 
实际应用中，自变量并不能精确地估计因变量。相反，与每 
个自变量的特定值相对应的因变量是一个随机变量。因此， 
我们常常使用集中趋势的测量方法，来概括自变量特定值域 
下的因变量变化情况，主要包栝均值、中位数和众数。 

传统的回归分析主要关注均值，即采用因变量条件均值 
的函数来描述自变量每一特定数值下的因变量均值，从而揭 
示自变量与因变量的关系。模型化和拟合条件均值函数 
( conditional-mean function ) 是回归模型法大族谱中的核心思 
想，具体包括常见的简易线性回归模型、多元回归、加权最小 
平方数下的异方差误差模型和非线性回归模型。 

条件均值模型具有以下优点:在理想的条件下，它们可 
以为我们提供关于自变量和因变量分布关系的完整的和参 
数的描述。另外，采用条件均值模型可获得具有优越统计特 
性的估计量(最小二乘法和最大似然法），它更容易计算，并 
且更容易解释。这种模型通过不同的方式被推广，从而适用 
于误差具有异方差性的情况，因此，对于特定的自变量，因变 
量条件均值和条件单位的模型化可以同时进行。 

条件均值模型被广泛应用于社会科学中，尤其在过去的 
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半个多世纪里，使用最小二乘法及其衍化方法对连续型因变 
量和自变量的关系进行回归建模被认为是现代重要的统计 
工具。最近，分析二分因变量的 logistic 和 probit 模型、分析 
计数因变量的泊松回归模型在社会科学研究中的重要性不 
断提高。这些方法并没有超出条件均值模型的框架。当社 
会科学定量研究者已经应用更高级的分析方法来放宽条件均 
值框架下的一些建模假设时，这个框架本身却很少被质疑。 

条件均值框架存在先天的局限性。首先，当归纳自变量 
特定数值下的因变量情况时，这个条件均值模型并不能轻易 
地扩展到非中心位置，而非中心位置往往正是社会科学研究 
的兴趣所在。例如，关于经济不平等和流动的研究对穷人 
(低尾)和富人(上尾）的情况有浓厚的兴趣。教育研究者会 
设法在既定的成绩水平下去理解和减少群体差异（如三层次 
参照标准 :基础 、熟练和高级）。这样，对中心位置的强调，长 
期阻碍了学者采用恰当的技术来研究有关因变量非中心位 
置的课题。而采用条件均值模型来分析以上问题是没有效 
率的，甚至会偏离研究重点。 

其次，这些模型的假设在现实生活中并不总会得到满 
足。特别是方差齐性假设经常被违反。另外仅仅关注集中 
趋势会忽视关于因变量分布的有用信息。并且，社会现象中 
通常会岀现重尾分布，从而导致离群值优势。正因为条件均 
值深受离群值的干扰，所以它对中心位置的测量是不恰当和 
具有误导性的。 

最后，一直以来对中心位置的关注转移了学者对因变量 
整体分布性质的注意力。我们需要跳出预测变量的位置和 
数值范围对因变量的效应这一框架，进而探讨预测变量的变 
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化会如何影响因变量分布的基本形状。例如，许多社会科学 
研究关注社会分层和不平等，这一领域要求深人分析因变量 
的分布特征。对分布特征的描绘包括中心位置、数值范围、偏 
态和其他高阶特性，而不仅仅是中心 位置。 因此，采用条件均 
值模型来表述因变量分布与自变量的关系是具有先天性缺陷 
的。关于不平等主题的例子包括工资、收人和财富等经济不 
平等; 在学业成绩上的教育不 平等; 在身高、体重、疾病发生概 
率、毒品上瘾、医疗和预期寿命上的健康不平等和由于社会政 
策而导致的生活质量的不平等。这些课题通常采用条件均值 
框架进行分析，从而忽略了其他更重要的分布特征。 

条件均值模型的替代方法可以追溯到18世纪中期。这 
一方法被称为条件中位数模型，或简称中位数回归。它解决 
了一些上面提出的关于集中趋势测量方法的选择问题。这 
种方法用最小绝对距离估计代替最小二乘估计。最小二乘 
估计不需要大功率的计算机便可轻松实现，然而最小绝对距 
离估计必须借助强大的计算机力量。所以，直到20世纪70 
年代后期，当计算机技术融合了如线性优化等算法系统时， 
采用最小绝对距离估计的中位数回归模型才变得实用。 

中位数回归模型可以实现与条件均值回归模型同样的 
目标: 表述因变量的中心位置与一组协变量之间的关系。然 
而，当因变量的分布是高度偏态时，均值在解释的时候就会 
受到质疑，而中位数依然保有大量信息。因此，条件中位数 
模型具有更大的应用潜力。 

中位数是一个特殊的分位数，它表示一种分布的中心位 
置。中位数回归是分位数回归的一种特殊情况，在这里，第 
0.5 分位数被模型化为一个关于协变量的函数。一般地说， 
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其他分位数则可以用来描述一种分布的非中心位置。分位 
数概念可归纳为一些特定的名称，如四分位数、五分位数、十 
分位数和百分位数。第 P 个百分位数表示因变量的数值低 
于这一百分位数的个案数占总体的 P %。 因此，分位数可以 
指定分布中的任何一个位置。例如，有 2. 5%的个案数值低 
于第 0.025 分位数。 

凯恩克 ( Koenker ) 和巴西特 （ Bassett) 在 1978 年引入分 
位数回归，将条件分位数模型化为预测变量的函数。分位数 
回归模型是线性回归模型的自然扩展。随着协变量的变化， 
线性回归模型描述了因变量条件均值的变化，而分位数回归 
模型则强调条件分位数的变化。由于所有分位数都是可用 
的，所以对任何预先决定的分布位置进行建模都将是可能 
的。因而，研究人员可以选择适合他们特定研究议题的分位 
数进行分析。贫穷研究关心低收人人群，例如，在2000年 
11. 3%的社会底层生活在贫穷状态中 （ U . S . Census Bureau , 
2001)。税收政策研究则关注富人，例如，最富有的4%的人口 
(Shapiro &• Friedman , 2001)。条件分位数模型为集中研究人 
口中的特定人群提供了灵活性，而条件均值模型则做不到。 

由于多元分位数可被模型化，所以我们可以更加全面地 
理解因变量的分布是如何受到预测变量的影响的，包括形状 
变化等信息。一组间距相同的条件分位数 （ 如总体中的每 
5%或每1%)可以描绘除中心位置外的条件分布的形状。这 
种模型化形状变化的能力是社会不平等研究领域在方法论 
上的一次飞跃。按照惯例，以往的不平等研究并不是建立在 
模型基础上的，这些方法包括洛伦兹曲线 （Lorenz curve ) 、基 
尼系数 （the Gini coefficient ) 、泰尔摘标准 （ Theil’s measure of 
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entropy ) 、方差系数和对数转换分布的标准差等。 

通过建立在线性优化基础上的算法系统，最小化关于距 
离的广义测量方法便可以轻松地建立分位数回归模型。因 
此，分位数回归目前是研究者的实用工具。社会科学家所熟 
悉的软件包则提供了简单易懂的命令来拟合分位数回归 
模型。 

在凯恩克和巴西特首次引入分位数回归的15年后，有 
关分位数回归的实际应用开始迅速普及。实证研究者通过 
分位数回归来检验预测变量对因变量分布的影响。由经济 
学家 ( Buchinsky ， 1994； Chamberlain , 1994) 完成的两篇早期 
实证研究论文，为我们提供了如何将分位数回归应用到工资 
研究中的实际例子。借助分位数回归，他们全面分析了工资 
的条件分布，发现教育和工作经验的回报以及工会成员身份 
的效应在不同的工资分位点上是不同的。采用分位数回归 
分析工资的例子不断增加，并且扩展至另外一些话题，如工 
资分布的变化 （Machado Mata , 2005； Melly ， 2005)、特定 
行业内的工资分布 (Budd &- McCall , 2001)、白人与少数族裔 
(Chay Honore , 1998) 、男性与女性 （Fortin Lemieux , 
1998) 的工资差距、受教育水平和工资不平等 （ Lemieux ， 
2006) 以及收入的代际转移 (Eide Showalter ， 1999)。分位 
数回归同样应用于分析学校的教育质量 （Bedi Edwards , 
2002； Eide、Showalter &- Sims , 200 2 ) 以及人 口特征对婴儿 
岀生体重的影响 （ Abreveya ， 2001)。分位数回归还延伸至其 
他领域，特别是社会学 （ Hao , 2005、 2006 a 、2006 b )、 生态学 
和环境科学 （ Cade、Terrell &- Schroeder , 1999； Scharf 、 
Juanes & Sutherland , 1989) ，还有医学和公共卫生等领域 
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(Austin et al . ， 2005 ； Wei et al . ， 2006)。 

本书旨在向那些对分布形状和位置的建模方法有着浓 
厚兴趣的社会科学家们介绍分位数回归模型。此外,本书同 
样适合那些关注线性回归模型易受偏态分布和离群值影响 
这一问题的读者们。该书的写作主要建立在凯恩克及其同 
事们的奠基性著作上（如 Koenker ， 1994； Koenker , 2005 ； 
Koenker &- Bassett , 1978; Koenker d ’ Orey , 1987; Koen ¬ 
ker &- Hallock , 2001 ； Koenker Machado , 1999) 并作出了 
两大新贡献。在分位数回归估计值的基础上，我们发展了基 
于条件分位数上形状变化的测量方法。这些测量方法为我 
们提供了关于协变量如何影响因变量的分布形状这一研究 
问题的直接答案。另外，为了获取更好的模型拟合效应，不 
平等研究常常对右偏的因变量分布进行对数转换，并未考虑 
在这种情况下“不平等”指的是初始数值的分布。因此，我们 
发展出一套方法，从对数单位系数中计算协变量对条件分位 
数函数的位置和形状的绝对值效应。 

从我们的研究经验中知道，这本书是为从事实证研究的 
学者而编写的。我们采用社会科学家熟悉的语言和步骤进 
行教学，具体包括定义清晰的术语、简化的方程式、插图、实 
证数据的图表和社会科学家熟悉的统计软件的计算编码。 

贯穿全书，我们从自己的家庭收人研究中提取实际例子进行 
讲述。为了更好地介绍分位数回归，我们使用简化的模型设 
定，在这里，不管是初始单位还是对数转换的因变量，其条件 
分位数函数对于协变量而言都是线性的和可加的。正如在 
线性回归中，我们介绍的方法可以轻松地应用于更加复杂的 
模型设定中，例如交互项和协变量的多项式或样条函数。 
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本书内容组织如 下:第 2章从两个方面定义分位数和分 
位数函数——运用分布函数和解决最小化问题。相对于分 
布矩阵(如均值、标准差），本章还提出测量分布位置和形状 
的分位差方法。第3章比较了线性回归模型和分位数回归 
模型 ( QRM ) 的基本原理，包括模型建立、估计量和特性。通 
过特定的分位数参数来建构多条分位数回归方程是分位数 
回归模型的独特性质。我们将展示如何运用最小距离原则 
来拟合分位数回归方程。 QRM 假设分布具有单调同变性和 
稳健性等特性，这些特性可为我们提供灵活稳健的估计，此 
外， QRM 还具有其他线性回归模型所不具备的性质。在第4 
章里，我们讨论了分位数回归模型的推论方法。除了介绍分 
位数回归系数的渐近推论外，本章还强调自举法的实用性和 
可行性。另外，相对于线性回归模型，我们还简短地讨论了 
分位数回归模型的拟合优度。第5章提出了多种解释分位 
数回归估计值的方法。本章超越了协变量对特定条件分位 
数(如中位数或其他非中心分位数)效应的传统检验，主要关 
注对分布的理解。它阐述了对分位数回归估计值的图像化 
解释和从分位数回归估计值中对形状变化的定量测量，包括 
位置转移、尺度变化和偏态变化等。第6章讨论与单调转换 
因变量相关的话题。我们提出了两种方法，从对数单位系数 
中获得协变量对条件分位数函数的位置和形状的绝对值效 
应。第7章讲述了本书介绍并加以发展的技术的系统运用。 
在本章中，我们分析了美国在1991年至2000年持续并扩大 
的收人不平等的原因。最后，附录提供了第2章解决最小化 
问题的中位数和分位数的证明以及执行第7章所描述的分 
析任务的 Stata 命令。 




分位数和分位数函数 
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描述并比较总体的分布特征，是社会科学的本质。描述 
分布最简单和最常见的方法，莫过于寻找代表中心位置的平 
均值和揭示离散程度的标准差。然而，将注意力仅仅局限于 
平均值和标准差，无疑会让我们忽视其他有助于深入挖掘分 
布特征的重要特性。对于许多学者而言，他们感兴趣的总体 
多为偏态分布，因此均值和标准差并不是测量位置和形状的 
最佳方法。为了描绘非对称分布的位置和形状特征，本章用 
累积分布函数 ( CDF ) 的方法介绍分位数、分位数函数及其特 
性，并且发展出测量分布位置和形状的分位差方法，最后将 
分位数重新定义为最小化问题的解决方法。 
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第1节丨分布函数、分位数和 
分位数函数 


我们可通过分布函数描绘一个随机变量 y 的分布。分 
布函数即在给定的函数 F y 中，对于每一个 y 值，当时 
在总体中所占的比例。图 2. 1呈现了标准正态分布的分布 
函数。分布函数可用做计算^值在任意区间占总体的比例。 
由图 2. 1可知， F y (0) = 0. 5和 PVC1.28) = 0. 9。我们可以 
通过这一函数计算所有其他关于 Y 的概率。特別有 PLY > 
>] = 1- F,(>-) (例如，在图 2. 1 中， P[Y> 1.28] = 1 — 
F^(l. 28) = 1 — 0.9 = 0. 1) 和 P[a < Y ^ = F Y ( b ) — 

F y (a)> (例如，在图 2. 1 中， P[0<Y<1.28] = PV(1.28) — 



图 2.1 标准正态分布的累积密度函数 
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Fv (0) = ().40)。分布函数最重要的两大特性是单调性(例 如. 
当 ： Vi < 为时， Fiy ^) < F ( y 2 )) 和它的极限 lim y , ... F ( v ) = 0 
和 linv ^. F ( y ) - 1 0 对于一个连续性随机变量 h 我们同样 
可用概率密度函数来表示它的分布.对于所有《和6的取值. 

都有 F [ a < y ^ ft ] = £ / Y dy 。 

让我们回到通过位置和离散并不足以充分描述一个分 
布的话题。假如我们知道白人家庭的平均收人 （ W ) 比黑人 
家庭的平均收人 ( B ) 多出20500美元。这可以简单描述成形 
状不变的分布图在位置上的移动（见图 2. 2 a 中对应的密度 
函数），因此这两种分布的关系可表示为 F ' Hy ) = I ^ iy - 
20500)。但事实上,这两种分布的差异同时体现在位置和形状 
上(见图 2. 2 b 中对应的密度函数），所以对于常数〃和> 
0)，两种分布之间的关系可归纳为 = 广(仰一 r )。 这就 
是当 J 的均值和方差在总体 W 和 B 之间都不相同时出现的 
情况。对位置和尺度的测量方法，如均值和标准差，或者中 
位数和四分位距，有助于我们比较两种分布的7属性。 

分布越不对称时，需要越复杂的分析方法。对分位数和 
分位数函数的考虑可为我们提供一系列丰富的分析方法。 
下面我们继续讨论分布函数 F ， 对于某些总体特征而言.该 
分布的第 P 分位数可表示为(或者当被讨论的总体 
是已知时，可简化为 Q 〜）， Q 〜 （ F ) 则代表分布函数在点 
上的反函数的值，即存在一个值 >使得 F (3；) = />。所以，处 
于 Q ( p ) 值之下的比例为 P %。 例如，在标准正态分布的例子 
中（见图 2. 1) ，因为 F ( l . 28) = 0. 9,所以 Q (°+ 91 = 1.28, 那就 
是在值 1. 28之下的比例为 0. 9或90%。 
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U ) 地点变换 



图 2. 2位置移动、位置和尺度变化(假设数据) 


类似于总体的分布函数，我们考虑对应于一个样本的经 
验或样本分布函数。对于一个包含值: Vi ，力，…，： y n 的样 
本，经验分布函数表示样本值小于或等于任意值^所占的比 
例。经验分布函数#的正式的定 义为： 

P (3；) =样本值小于或等于3；值所占的比例 


例如.考虑一个包含20户家庭收人情况的样本（单 位：美 





14 


I 分位数回归横型 


元）， 3000、 3500、 4000、 4300、 4600、 5000、 5000、 5000、 
8000、 9000、 10000、 11000、 12000、 15000、 17000、 20000、 
32000、38000、56000和84000。由于8户家庭的收人在 
5000美元以下，所以我们有 FC 5000) = 8/20。这一经验分布 
函数图如图 2. 3所示，包括一个上涨部分和几个平坦部分。 
例如，在5000美元这一点，上涨部分达3/20,这表明在该样 
本中，5000美元出现了 3 次; 而平坦部分则出现在56000美 
元和84000美元之间，这表明在这两点之间不存在其他样本 
值。因为经验分布函数存在平坦部分,所以在某些值上存在 
多个反函数。例如，如图 2. 3所示，在56000和84000之间的 
Q ( °_ 975> 是一个存在多种选择的连续统。因此，当我们采用分 
位数和分位数函数来分析一般性分布时，需要留意以下定义^ 



0 20000 40000 60000 80000 100000 


收入 

图 2. 3具有跳跃和水平部分的累积密度函数 

定义: 一条分布函数下的第分位数 QW 是一组 J 值中 
的最小值，从而使 F ( y ) p a 函数(作为/>的函数）正是 
F 的分位数函数。 
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图 2. 4展示了分位数函数和与之相应的分布函数。由 
此可以观察 到:分 位数函数是一条从底端开始的单调非递减 
的连续性函数。 




p 

分位数函数 


图 2. 4累积密度函数及其相应的分位数函数 


作为特殊的例子，我们讨论样本分位数，它可用做估计 
抽样分布的分位数。 

定 义:给 定一个样本： yi ， M ，…，％，我们将第 P 样本分 
位数定义为相应的经验分布函数 f 的第 f 分位数，即 
Q <p, = Q lp \ F) a 与之相应的分位数函数，就表示为样本分 
位数函数。 

样本分位数与顺序统计量密切相关。假定样本义，戈，…， 
%， 我们按其大小从低到高排列，则表示为，…，％„>，有 
<‘"<九)。有些数值如果出现多次，它们会被重 
复。顺序统计量和样本分位数的关系可简单描述如下 :对于 
大小为〃的一个样本，第 a /«) 样本分位数由确定。例 
如，在以上的 20 户家庭收入数据中，第 （4/20) 的样本分位 
数，即第 20百 分位数，等于 Q (0 - 2) =^<4> = 4300。 
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\ 分位数回归模型 


第2节 I 样本分位数的抽样分布 


样本分位数在大样本中会如何表现，是需要重点关注 
的。对于一个从某分布中抽取的大样本: y ( i > ，…， ： y < n > ，该分 
布的分位数函数为概率密度函数为/= F ， 的分 

布接近均值为、方差为 pil ^ p -- • f ( ^ p ))2 的正态分布。 

特别的，这一样本分布的方差完全由在分位点上估计而来的 
概率密度决定。这种对分位点上的密度的依赖有简单直观 
的解 释:如 果分位数附近有较多数据点（更高的密度），那么 
样本分位数更稳定；相反的，如果分位数附近有较少数据点 
(更低的密度），那么样本分位数较不稳定。 

为了估计分位数抽样的变异性，我们可以利用以上的方 
差近似值，但这需要事先估计未知的概率密度函数。图 2. 5 
给我们展示了一种标准的估计方法，函数 d ( p ) 在点；> 的切线 
斜率是分位数函数在 P 点上的导数，同样的，有密度函数的 

倒数： = 1//( Q ^) 。这一项式接近点 ( P ~ h , Q lp ~ h> ) 
和 ( p + h , Q ^ + w ) 的割线 斜率士 （(2 ( _ — A) )， 尤其当 


A 为极小值时。 
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Q(P) 



注: 函数在九点的导数(切线的斜率>约等于割线的斜率。 

围 2. 5如何估计分位数函数的斜率的图示 








I 分位数回归模型 

第3节 | 位置和形状的分位差 


测置方法 


社会科学家们熟悉关于中心位置的分位差测量方法，即 
是中位数(如50%分位数）而不是均值（密度函数的第一阶 
矩)被用作指示偏态分布的中心。 

通过基于分位数的位置允许我们研究更多非分布中心 
的位置概念。具体来说，我们可以由此检验特定子样本中的 
低尾位置(如10%分位数)或者上尾位置(如90%分位数）。 

描述分布形状的两大基本属性是尺度和偏态。尺度一 
般通过标准差测量 得到; 标准差则通过数据值与均值的差的 



容易的，但当分布变得高度不对称时，对它的解释便站不住 
脚。同样的情况也出现在重尾分布（ heavy-tailed distribu - 
tion ) 上。由于许多用以描述社会现象的分布是偏态的或者 
是重尾的，因此使用标准差来表示它们的尺度便会出现问 
题。放弃使用标准差来捕捉分布的离散程度，我们可以使用 


选定 P 值下的分位差尺度测量法 (quantilebased scale meas ¬ 


ure ， QSC ) : 


Q6C (p) = Q l ~ p) - Q ip) for / ><0.5 


[2.1] 
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我们可以通过 a ooz5, fp a a 975> 获得总体中间位置的95% 
分布，或者通过0 25> 和0^ 75> 获得中间位置的50%分布 ( 即传 
统意义上的四分位距），或者任何中间部分的 100(1 — 2/>)% 
分布。 

QSC 不仅提供了直接有效的尺度测量方法，而且促进了 
基于模型的尺度变化的测量方法的发展（详见第5章）。相 
比之下，根据由标准差测量的尺度变化来析出预测变量效应 
的模型方法，限制了我们发现其他模式的可能。 

测量分布形状的第二种属性是偏态。这一属性是许多 
不平等研究的核心所在。偏态通过数据值与均值的差的三 
次函数来计算。当数据围绕样本均值对称分布时，偏态的值 
等于0。负的偏态值对应左偏 分布; 反之，正的偏态值则对应 
右偏分布。换言之，偏态的存在，表明中位数以下的分布和 
中位数以上的分布出现了不平衡。 

尽管偏态常常被用做描述分布的非正态性，但是偏态需 
要通过分布的高阶矩计算得到，这一事实限制了偏态的作 
用。我们需要寻找连接属性（如偏态）和协变量的更灵活的 
方法。与动差法 （ moment-based measure ) 相比，样本分位数 
可以在许多方面描述分布的非正态性。分位数和分布形状 
的简单结合有助于进一步发展出模型化分布形状变化的方 
法(这一方法将在第5章讨论）。 

非对称的上端和下端部分可通过分位数函数表达。 
图 2. 6分别描述了正态分布和右偏分布的分位数函数。正 
态分布的分位数函数围绕第 0. 5分位数（中位数)对称分布。 
如图 2. 6 a ， 分位数函数在第 0. 1分位数的切线斜率等于在第 
0.9 分位数的切线斜率。其他低一高对应的分位数同样具备 
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I 分位敷回归棋型 


这一特性。相比之下，偏态分布的分位数函数围绕中位数的 
分布则是不对称的。如图 2. 6 b ， 分位数函数在第 0. 1分位数 
的切线斜率明显不同于在第 0. 9分位数上的切线斜率。 




0 0 . 1 0.2 0. 3 0.4 0.5 0.6 0 . 7 0.8 0.9 1 

P 

Cb ) 偏态 

图 2. 6正态对偏态的分位数方程 


用上端部分 (upper spread ) 表示中位数之上的分布情况， 
而下端部分 (lower spread ) 对应于中位数之下的分布。对于 
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对称分布而言，上端部分和下端部分是相同的。另一方面， 
在右偏分布中，下端部分远远短于上端部分。我们将分位差 
偏 态测量 （ quantile-based skewness , QSK ) 量 化为上端部分 
与下端部分的比值减去1。 

QSK ip> = ( Q (l —— Q (aw )/( Q (0 S) ~ Q P， ) — 1 for 户 < 0. 5 

[ 2 . 2 ] 

量化的通过减去 1 而重新回到中心位置，因此对 
于对称分布而言，它依然等于0。当值大于0时，为 
右偏 分布； 当 QSK …值小于 0 时，为左偏分布。 

表 2. 1 呈现了图 2. 6 中的对称分布和右偏分布的 9 个分 
位数，上端部分和下端部分，4个不同 p 值下的 QSKW 值。 
对于对称分布而言， QSK ( # 等于0;而在右偏分布中，该值在 
0. 3 至 1. 7 之间。 QSKW 的定义简单明了，并且可扩展至测 
量由协变量导致的偏态变化(见第 5 章）。 


表 2.1 分位差偏态测量方法 


总体 

比例 


对称分布 



右偏分布 


分位数 

下端或者 
上端部分 

QSK 

分位数 

下端或者 
上端部分 

QSK 

0. 1 

100 

110 

0 

130 

60 

1.7 

0. 2 

150 

60 

0 

150 

40 

1. 3 

0. 3 

180 

30 

0 

165 

25 

1.0 

0. 4 

200 

10 

0 

175 

12 

0. 3 

0. 5 

210 

— 

— 

190 

— 

— 

0. 6 

220 

10 

— 

210 

20 

— 

0. 7 

240 

30 

— 

240 

50 

— 

0. 8 

270 

60 

— 

280 

90 

— 

0. 9 

320 

110 

— 

350 

160 

— 
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分位敝回归模型 


到目前为止，我们根据 CDF 定义了分位数，并且发展出 
了分位差形状测量方法。另一种分位数的替代性定义有助 
于我们进一步理解分位数回归的估计量(见下一章），我们建 
议对此感兴趣的读者继续阅读下一部分，而其他读者可跳至 
小结部分。 
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第4节 | 分位数作为某些最小化 
问题的解决方法 


分位数同样可作为某些最小化问题的解决方法。由于 
下一章将讨论分位数回归估计量的意义，所以我们需要引入 
新的定义。在这里，我们从中位数(第 0. 5分位数)开始讨论。 

为介绍最小化问题，我们首先考虑大家熟悉的 y 分布的 
均值我们通过平方差 ( Y -^ y 可以测量 y 的某一数据点 
与均值 "的 距离，然后通过期望平方差 £[( y —沁 2 ]计算 y 
与均值 v 的平均距离。 

定义分布中心的一种方法是寻找 p 值从而使得 y 的均 
方差 （average squared deviation ) 最小化。因此，我 们有： 

£[(Y-^) 2 ] = E[y 2 ]-2£[y> + ^ 2 

= (fjL - e[y] ) 2 + (e[yj - (E[y] ) 2 ) 

=("—£[ Y ]) 2 + Var ( Y ) [2.3] 


因为第二项 Var ( y ) 是固定的，我们可通过最小化第一 
项（/^一£[7]) 2 从而最小化方程2.3。当" = £[ Y ] 时，可使 
第一项等于0,同时最小化方程 2. 3,除此之外 "的其 他值都 
将使第一项为正值而使方程 2. 3偏离最小值。 

相似的，样本大小为《的样本均值同样可作为最小化问 
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分位数回归模型 


题的解决方法。我们寻找最小化平方均差 1 ：£ (乂一沁 2 的 

n i = i 

"值： 

— 公 ()，_—") 2 = 士 公 ( " 一刃 2 十士 S ^，-^) 2 

= ifjL — yY + s ^ [2.4] 

这里，5表示样本均值，^表示样本方差。解决最小化 
问题就是使第一项尽可能小，那就是使// =夕。 

具体而言，我们考虑包括下列9个值的样本：0. 23, 
0. 87, 1. 36, 1. 49, 1. 89, 2. 69, 3. 10, 3. 82和 5. 25。样本 
数据点与特定 P 值的均值平方差的描绘图如图 2. 7 a 所示。 
注意最小化函数的数值点位于平滑抛物线中间凸起的部分。 

而中位数 m 也具有相似的最小化性质。相对于使用平 
方距离，我们可根据绝对距离 |Y —《|测量 Y 与 m 的距离， 
并且根据平均绝对距离 （mean absolute distance ) E | Y — m | 
计箅总体中 Y 与 m 的平均距离。同样在最小化£：丨 y — m I 
的情况下，我们得到值 m 。 我们知道， | Y~m | 函数也是中 
部凸起的，因此，寻找某特定值，使得与 w 相关的导数等于0 
或者两个方向导数 （directional derivatives ) 的正负符号不一 
致，这样 I Y ~ m \ 函数便实现了最小化。这个答案便是分布 
的中位数(详细证明见附录1)。 

下面，我们讨论具体例子。我们将 m 至样本点的平均绝 

对距离定义为- 2 \ yi ~ m \ a 对于上面提到的包括9个 
n 7^1 

样本点的样本，它的平均绝对距离函数如图 2. 7 b 所示。对 
比于图 2. 7 3 所展示的函数图（均方差），图 2. 7 b 的函数在外 
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观上同样是中部凸起的拋物线。然而，图 2. 7 b 的函数并不 
是平滑的曲线，而是每个样本点上的切线斜率有明显变化的 
分段直线。图中函数的最小值与样本中位数 1.89 —致。这是 





( a ) 的方差中位数 



( b ) m 的绝对距离中位数 

图 2.7 平均数和中位数作为最小化问题的解决方案 
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众多现象中的特殊例子。对于任何样本，由 /( m ) = - S 

n T~\ 

I y, — m I 定义的函数是 “ V ” 形函数 /,( m ) = I y, — m \ /ra 的 
总和（见图 2. 8, 函数 /; 对应数据点: v, = 1. 49 )。 当 m : y; 
时，函数/,有最小值0;并且当 w <： y , 时，它的导数为一 1/ w ; 
当> ： y , 时，其导数为1/«。当该函数在 w = ^,上不可微 
时，在负向上有方向导数一 1/»，在正向上有方向导数 1 /wo 
作为这些函数的总和，/对 m 在负向上的方向导数为 (r~ 
s)/n, 在正向上则为 (s-r)/n; 这里.是 m 值右边的样本点 
数， r 是 m 值左边的样本点数。/的最小值出现在当 W 的右 
边样本点数和左边样本点数相等时，即 w 为样本中位数。 



图 2.8 用于解决最小化问题的中位数的 V 形函数 

对中位数的表述可推广至其他分位数上。对于任何 
(0, 1), Y 至特定 g 值的距离可由绝对距离测量，但根 
据 Y 是位于 g 的左边还是右边，我们赋予不同的权重。因 
此，我们将 y 至特定值的距离定 义为： 
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d q { Y , q ) = 


Ul ~ p ) I Y~q I 

1 P I Y~q I 


Y<q 

Y^q 


[2.5] 


我们寻找使 Y 的均值距离最小化的值 q ： E \_ d P ( Y , 5 )] 0 
当<?是第 P 分位数时便达到最小值(见附录1)。 

同样的，第 々样 本分位数正是使平均(加权)距离最小化 
的 g 值。 


Yjd p (y,, 


V 


n 


>,<? 
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第5节 | 分位数的性质 

THTW'-niii 觀 if_ii n ii_iiiimnMriiii'iii rr irriTBi _i Tn 了 ir ri 「 i 厂「 「 .. . . 


分位数的一个基本性质是单调同变性 (monotone equiva ¬ 
riance ) „ 如果我们对一个随机变量进行函数 h 的单调转换 
(如指数或对数函数），分位数可通过对分位数函数进行同样 
的转换而得利。换言之，如果9是 Y 的第/>分位数，那么 
AG ?) 是的第/>分位数。同样的情况存在于样本分位数 
中。例如，对于一个样本数据，由于我们知道第20百分位数 
是4300，如果我们对数据进行对数转换，转换后的数据中第 
20百分位数就是 log (4300) = 8. 37。 

样本分位数的另一个基本特性是他们对离群值的不敏 
感性。这一特性类似于分位数回归的特性，将使分位数和分 
位差程序 （ quantile~based procedures ) 在许多情况中变得实 
用。假如有中位数为 m 的样本数据;^，…， x „ ，我们将一个 
位于中位数之上的数据值 X, 替换成同样在中位数之上的其 
他值，从而修改了样本。同样，我们也可以将一个位于中位 
数之下的数据值替换成同样在中位数之下的其他值。这样 
的修改对样本中位数 [1] 没有任何影响。任意第 f 样本分位 
数同样拥有相似的特性。 

我们将这种情形与样本均值进行比较 :将样 本值: c , 改为其 
他值；+厶将使样本均值变化 A / n 。 这样，个别数据点对样本 
分位数的影响是有限的，但对样本均值的影响则并非如此。 
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第6节 | 小结 


本章介绍了分位数和分位数回归等概念。我们通过分 
布函数定义分位数和分位数函数，并发展出测量分布位置和 
形状的分位差测量方法;还通过与传统分布矩 （conventional 
distribution moments ) 相比较，强调了它们的实用性。另夕卜， 
为了让读者更加了解分位数回归的估计量，我们将分位数重 
新定义为最小化问题的解决方法。有了以上准备，我们进人 
下一章讨论分位数回归模型及其估计量。 







分位数回归模型及其估计量 
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分位数回归模型 


第2章讨论的分位数函数足以用来描述和比较单变量 
的分布情况。然而，当需要对一个因变量与一组自变量的关 
系进行建模时，我们必须在分位数函数的基础上引人回归， 
即分位数回归模型 （ QRM )。 对于一组协变量，线性回归模 
型 ( LRM ) 代表条件均值函数，而 QRM 代表条件分位数函 
数。以 LRM 为参照标准，本章介绍 QRM 及其估计量，比较 
LRM 和 QRM 的基本模型设置， LRM 的最小二乘估计和 
QRM 的类似估计方法,还有两类模型的其他特性。下面，我 
们将通过分析家庭收人 [2] 的实证例子来阐明本章的基本 
观点。 
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第1节 I 线性回归模型及其局限性 


在社会科学研究中， LRM 是广泛使用的标准统计模型， 
但它只关注因变量的条件均值,而没有充分考虑因变量条件 
分布的完整特征。相比之下， QRM 有助于我们分析因变量 
条件分布的完整特征。在某些方面， QRM 和 LRM 是相似 
的，两种模型都可处理具有线性未知参数的连续型因变量， 
但 QRM 和 LRM 对不同的量进行建模，并且依赖于对误差 
项的不同假设。为了更好地理解这些相似点和不同点，我们 
首先讨论 LRM ， 然后再介绍 QRM 。 为了解释方便，我们集 
中讨论单一协变量的例子。当扩展至多个协变量时，虽然会 
增加额外的复杂性，但其思想在本质上是相同的。 

假设 J 为依赖于1的一个连续型因变量。在我们的实 
证例子中，家庭收人是因 变量。 对于 _ r , 我们用定距变量 ED 
(户主的受教育年限)表示，或者用虚拟变量 BLACK (户主的 
种族，黑人为1，白人为 0) 代替。在微观单位(在本例中是家 
庭户）的样本中，数据是以 （: r ,， M ) 的形式成对出现的，其中 

= 1，…，7? 0 

通过 LRM , 标准线性回归模型可表 示为： 


y t = 汉十戽 x, +e, 


[3. 1] 
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在这里服从均值为0、方差 Y 未知的正态独立同分布。 e ; 
的均值假设为0的结果是，我们可看到拟合数据的函数戍+ 
尽: c 与 x 取特定值时的 y 的条件均值(表示为 ED I _ r ]) 相对 
应，这可被理解为与协变量: c 特定值相对应的总体3；值的平 
均数。 

例如，当我们以受教育年限为协变量，进而拟合线性回 
归方程 3. 1时，我们得到预测方程 f =一 23127 + 5633 ED , 
因此将选定的受教育年限代入方程中，将得到以下有关收入 
的条件均值。 


ED 9 12 16 

E[y|ED] $ 27570 $44469 $67001 


假设这是一个完美的拟合，我们便可以将这些数值理解 
为拥有特定受教育年限的个人所获得的平均收人。例如，受 
过9年教育的个人的平均收入为27570美元。 

相似的，当协变量为 BLACK 时，这一拟合回归方程为 
夕= 53466 - 18268 BLACK , 当代人协变量的数值时，我们 
得到以下数值。 


BLACK 0 

Ely\BLACK2 $53466 


1 

$35198 


假设上述拟合模型确实反映了总体真实情况，我们可将这些 
值当做子总体的平均值，例如白人家庭的平均收人为53466 
美元，而黑人家庭则为35198美元。 

因此，我们得知了线性回归模型的一个基本原则，那就 
是它通过利用分布的均值来表示其集中趋势，从而尝试描述 
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条件分布的位置的变化情况。 LRM 的另一个基本特征是要 
求满足方差齐性 假设； 即假设条件方差 Var (^| x ) 对于协变 
量的所有取值都等于常数 a 2 。 当方差齐性假设不满足时，可 
以通过同时对条件均值和条件尺度进行建模而调整 LRM 0 
例如，我们可以调整方程 3. 1从而对条件尺度进行 建模： 
y , =/3 t +/?. x ,+^ e ,, 这里 y 是另一个未知的参数，我们可写 
成 Variy | x ) = a 2 〆 。 

因此，对 LRM 的运用，反映了协变量与因变量关系的某 
些特征，并可用于完成模型化尺度变化的任务，而尺度变化 
被认为是条件分布最重要的形状改变。然而，对条件尺度的 
估计并不总是可以通过统计软件轻易获得。另外，线性回归 
模型对建模者设有明显的限制，并且，使用 LRM 来模型化更 
加复杂的条件形状变化，是很具挑战性的。 

为了描述采用 LRM 难以模型化的形状变化类型，读者 
可想象一些极端情况。对于大家感兴趣的一些总体，我们有 
一个因变量^和协变量工，它们的特征是在工=1，2, 3时 a 
的条件分布拥有图 3. 1所示的概率密度。该图上的三种概 
率密度函数拥有相同的均值和标准差。由于因变量 y 的条 
件均值和尺度并不随着: c 而变化，所以通过对这些总体中的 
样本拟合一个线性回归模型，并不能提供有用的信息。为了 
理解协变量是如何影响因变量的，我们需要一个新的工具。 
分位数回归便是完成这一任务的恰当方法。 

LRM 的第三个显著特征是它的正态性假设。因为 
LRM 确保传统的最小二乘法可以最好地拟合数据，如果不 
做正态性假设，我们也可以通过 LRM 达到纯粹描述的目的。 
然而，在社会科学研究中， LRM 主要用来检验解释变量是否 
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图 3.1 平均数和标准差相同但偏斜不同的条件分布 


对因变量具有显著影响。假设检验需要超越参数估计，并且 
要求确定估计量的抽样偏差。 P 值的计算依赖于正态性假 
设或者大样本近似值。如果违反这些条件，那么/>值可能是 
有偏的，并且将导致无效的假设检验。 

另一个与 LRM 相关的假设，是要求使用的回归模型适 
用于所有数据，我们称之为单一模型假设 （onemodel as¬ 
sumption)。 LRM 中的离群值(不符合数据大多数情况的值) 
将对拟合的回归直线产生不良'的影响。通常的做法是在 
LRM 中确定并去除这些离群值。但离群值的意义及去除离 
群值的操作会破坏许多社会科学研究的结论，尤其是关于社 
会分层和不平等的研究，在这里，离群值和它们相对于多数 
数据值的位置是研究的重点。在建模方面，我们可能需要同 
时模型化大多数个案的关系和模型化离群值的关系，这一任 
务是 LRM 不可能完成的。 

我们将用家庭收人数据举例说明以上提到的所有 特性： 
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以分布的观点看到的条件均值的局限，对方差齐性假设、正 
态性假设及单一模型假设的违反。图 3. 2展示了不同教育 
和种族群体的收人分布。收人的位置在三类不同教育群体 
之中和黑人与白人之间的变化是明显的，并且它们的形状也 
存在重要差异。因此， LRM 的条件均值无法表述由于协变量 

600 - 
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400 - 
谳 

§ 300 - 

o 

200 - 

L00 - 


9年学校教育 12年学校教育 16年学校教育 

Ca ) 受教育年限分组 



( b ) 种族分组 



'^*0001 


图 3. 2家庭收入图示 
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(教育或种族)的改变而导致的形状变化。另外，由于不同教 
育群体和两大种族的收人分布存在实质性差别，方差齐性假 
设便无法满足，而且也无法准确地估计标准误。图 3. 2中的 
箱线图都是右偏的。条件均值和条件尺度模型不可能检测 
这些类型的形状变化。 

通过检验残差图，我们可以识别7个离群值，包括受教 
育年限为18而收人超过505215美元的3个个案，还有受教 
育年限为20而收人超过471572美元的4个个案。当在教 
育一收入模型中增加代表这些离群值阶层身份的虚拟变量 
时，我们发现这些个案使得截距额外增加了 483544美元。 

这些结果表明， LRM 方法的不足是由多方面的原因造 
成的，其中包括异方差性与离群值假设和对多种形状变化形 
式的检测失败。这些不足不仅出现在关于家庭收人的研究 
中，并且当采用其他测量方法时也会存在。因此，我们需要 
一个替代性的方法，用来处理异方差性和离群值，并检测形 
状变化的多种形式。 

正如上面提到的，条件均值无法识别形状变化。条件均 
值模型并不总是可以正确地模型化中心位置的变化，尤其是 
当因变量的分布不对称时。对于一个对称的分布，均值和中 
位数是一致的，但偏态分布的均值和中位数(第 0. 5分位数） 
则是不一致的。表 3. 1描述了家庭收人分布的一组简单统 
计数字。分布的右偏态性使得均值远大于中位数，不论是在 
整个样本中还是教育或种族的子样本中（见表 3. 1的首两 
行）。当分布的均值和中位数不一致时，中位数可以更加准 
确地表示分布的集中趋势。当我们检验中位数而不是均值 
时，三类不同教育群体和黑人与白人之间的收入位置的变化 
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幅度会小很多。这一差异增加了我们使用条件均值方法模 
型化非对称分布的位置变化时的忧虑。 


表 3.1 家庭收入分布(总体，教育组和种族组> 



总体 

ED - 9 

fD - 12 £1) - 16 

WHITE 

BLACK 

均值 

50334 

27841 

40233 

71833 

53466 

35198 

分位数 







中位数 







(第 0.5 分位数） 

39165 

22146 

32803 

60545 

41997 

26763 

第 0. 1 分位数 

11022 

8001 

10510 

21654 

12486 

6837 

第 0. 25分位数 

20940 

12329 

18730 

36802 

23198 

13412 

第 0. 75分位数 

65793 

36850 

53075 

90448 

69680 

47798 

第 0. 9分位数 

98313 

54370 

77506 

130981 

102981 

73030 

分位差尺度 (QBC) 







(Qn. 75 ~Qo.25) 

44853 

24521 

34344 

53646 

46482 

34386 

(Qi：. 9~ Q 1 ^ 

87291 

46369 

66996 

109327 

90495 

66193 

分位差偏态 (QHS> 







(Qo. ?5~Qi). r o ) 1 

0. 46 

0. 50 

0. 44 

0. 26 

0. 47 

0. 58 

(Qo. 5~ Qo. 25 ) 







(Q u—Qa ) . 

( r\ — r\ \ 1 

1. 10 

1. 28 

1. 01 

0.81 

1. 07 

1. 32 
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第2节 | 条件中位数和分位数 
回归模型 

*, i t-'Ji - r - .1 ■=" > • ' . 


对于一个偏态分布，采用中位数测量集中趋势是更适合 
的，因此，条件中位数回归 （conditional median regression ) 而 
不是条件均值回归，应该被考虑用做模型化位置的变化。条 
件中位数回归模型在18世纪中期由 Boscovich 首次提出，随 
后由 Laplace 和 Edgeworth 加以研究。中位数回归模型弥补 
了 LRM 条件均值估计的不足。中位数回归估计的是协变量 
对条件中位数的影响效应，所以即使分布是偏态的，它也可 
以代表分布的中心位置。 

为了模型化位置变化和形状变化，凯恩克和巴西特 
(1978) 提出了比中位数回归模型更为一般化的模型——分 
位数回归模型 （ QRM )。 QRM 估计了协变量潜在的微小变 
化对条件分布中各种不同的分位数的影响，例如，从第 0. 05 
分位数到第 0. 95分位数之间的19个等距分位数。通过中 
位数和非中位数的分位数，这19条拟合的回归线可以捕捉 
位置的变化（中位数的回归线），还有尺度和更复杂的形状变 
化(非中位数的回归线）。因此， QRM 可以估计协变量对整 
个分布的微小影响，并且顾及到了异方差性。 

根据凯恩克和巴西特的设定，与方程 3. 1中的 LRM 相 
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对应的 QRM 可表 示为： 

y , = ^ +^ P > x ,+£ i p， [3. 2] 

在这里，0</>< 1表示数值小于第 P 分位数的比例。回到 
LRM ， 特定; r , 值下的％的条件均值为 I x ,-]= / S ) + i 9 1 x ! , 
并且误差项 e , 的期望值为0。而与之对应的 QRM ， 在特定; r , 
值下的第/>条件分位数为 QW (乂 I X,) 十甿 X ,。 这样， 
第 P 条件分位数是由特定分位数下的参数和协变 
量: T , 的特定值决定的。正如 LRM , 在关于误差项£,的假定 
下， QRM 同样可被公式化。由于 +/f 是固定的，因此， 
如果要使 I : r ,) =/f +^ x ,+ a p, Ce ,)=^ +^ P ， sc ,, 

则要求误差项的第 P 分位数等于0。 

需要重点留意的是，对于分位数的不同值而言，特定； 
下的误差项是彼此相关的。事实上，用代替 P 后，方程 
3. 2 变成 y , =故广 + ^ jt , + £ 1 (,> ,从而有 — £”> = (f — 

+ x ,(/3； ,) 一 f ) ， 所以这两个误差项在特定: c , 下相差一 
个常数。换言之，的分布和 ef 的分布只是彼此的一种位 
移(分布形状不变）。另一个需要考虑的关于 QRM 的重要的 
特殊情况是，当< =1，…， 〃时， 服从独立同 分布； 我们 
将此视为 i . i . d 情况。在这一情形下 ， e W 的第 <7分位数是依赖 
于户和 g 而不是的常数 C p , „。利用方程 3. 2,我们可将第 g 
条件分位数方程写成 (JA l - r ,)= a p) (^, I 不) + c p . ,。[ 3 ]所 
以我们的结论是，在 i . 1. d 情况下，当斜率换成一般值饵 
时.条件分位数方程只是彼此的一种简单的位移情况。换言 
之， i . 1. d 假设指的是因变量的分布不存在形状变化。 

方程 3. 1中的 LRM 只有一个由一条方程式表示的条件 
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均值，与之不同的是，方程 3. 2表明 QRM 拥有多个条件分位 
数。这样，多个方程可以以方程 3.2 W 的形式表示。例如，如 
果 QRM 指定19个分位数，这19个方程会产生关于 I ,的19 
组系数，分别表示19个条件分位数° 5) ， 皮 '…， yf 95> )。 
这些分位数并不要求一定是等距的，但在实践中，将它们设 
为等距的会便于解释。 

在我们的例子中，拟合方程 3. 2将产生在已知教育或种 
族情况下的收人的19个条件分位数的估计值（见表 3. 2和 
表 3. 3) 。教育的系数从第 0. 05分位数的$ 1019单调递增至 
第 0. 95分位数的$8385。相似的，在低端分位数中的黑人 
种族效应小于在高端分位数的情况。 

12年受教育年限的条件分位 数是： 


p 0. 05 

E(y, | ED, = 12) $ 7976 

0. 50 

$ 36727 

0. 95 

$111268 

黑人种族的条件分位 数是： 

p 0. 05 

0. 50 

0. 95 

Eiy t | BLACKi = 1) $ 5432 

S 26764 

$91761 


这些结果与 LRM 条件均值的结果十分不同。条件分位数描 
述了一种条件分布，被用以概括位置和形状的变化。对 
QRM 估计值的解释是第5章和第6章的话题。 

图 3. 3描述了从总样本抽取的大小为1000户家庭的随 
机样本情况，左图描述了基于户主受教育年限的家庭收人的 
散点图和 LRM 的拟合直线。这单一的回归直线描述了均值 
的变化，例如，从12年受教育年限的均值$ 22532转换为16 
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年受教育年限的均值 [5633 X ( 16 —12)]。但是，这条回归直 
线无法捕捉形状的变化。 



0 5 10 15 20 0 5 10 15 20 

线性回归 分位数 M 归 

图 3. 3教育对家庭收入的条件平均数和条件分位数的彩响 
(1000 个随机家庭样本） 

图 3. 3中的右图呈现了与左图一样的散点分布和19条 
分位数回归线。50%分位数（中位数）的拟合线描述中心位 
置的变化，说明教育和条件中位数收入的正向关系。这一回 
归线的斜率为$4208。当受教育年限从12增加至16时，收 
人增加的幅度达 $ 16832[4208 X (16 — 12)]。这一变化小于 
LRM 中的均值变化。 

除了位置变化的估计外，其他18条分位数回归线提供 
了关于形状变化的信息。这些回归线都是正向的，但有着不 
同的斜率。这些回归线在低教育水平处密集（如0—5年的 
受教育年限），但在高教育水平处（如16- 20年的受教育年 
限），彼此的偏差越来越宽。通过低教育水平处的斜线密集 
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和高教育水平处的斜线分散情况，可以描述形状的变化。例 
如，受教育年限为16的条件收人(第 0 . 05条件分位数上的 
$ 12052变为第 0. 95条件分位数上的$ 144808) 的变化幅度 
大于受教育年限为12的变化幅度（第 0 . 05条件分位数上的 
$ 7976变为第 0. 95条件分位数上的$ 111268)。因此，非中 
位数条件分位数将位置变化从形状变化中分离出来。这一 
特征在确定协变量对因变量条件分布的位置变化和形状变 
化的影响效应上是至关重要的。这一话题将在第5章和对 
QRM 结果的解释一起讨论。 
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第3节 I 分位数回归 （ QR ) 估计 


我们通过回顾最小二乘估计而将 QR 估计放在熟悉的 
情境中讨论。最小二乘估计通过计算最小化残差的参数值， 
从而实现反和及的参数估计： 

riling] ,. [: y ,— (爲 +/3 1 _r,)] 2 [3. 3] 

如果 LRM 假设是正确的，当样本容量趋向无穷时，这一 
拟合的响应函数良+ &将接近总体的条件均值 I x)。 
在方程 3. 3中，最小化的部分是数据点 U,， 又）到拟合直线 
y =爸 0 + 氣工的垂直距离的平方总和。 

一个类似的最小化方法可通过如下步骤实现： （1) 分别 
对方程 3. 3在择和碎处求偏 导数； （2) 设定每个偏导数都等 
于0; (3) 求解这个二元方程组。这样我们得到两个估 计量： 

n 

八 XI (A 一 5 )(乂 一夕） 六 卜 

备、=」 --- ，= y ~ 

X) (x, — X ) 2 
1 

与 LR 估计量明显不同的 QR 估计量的特点在于，在 QR 
中，数据点到回归线距离的测量通过垂直距离的加权总和 
(没有平方)而求得，这里赋予拟合线之下的数据点的权重是 
1- P ， 而赋予拟合线之上的数据点的权重则是 P。 对于 P 的 
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每一个选择，如 ^ = 0. 10, 0.25, 0. 50,都会产生各自不同的 
条件分位数的拟合函数。这一任务是为每一个可能的寻找 
适合的估计量。读者需要留意第2章中讨论过的，分布的均 
值可被看做最小化总体平均平方距离的值，而分位数<?可被 
看做最小化平均加权距离的值——根据数据点在9值之上 
还是之下而进行加权。 

具体而言，我们首先考虑中位数回归的估计量。在第2 
章中，我们解释了为何3<的中位数 m 可被视为 E | y — m | 的 
最小化值。与中位数回归例子相似的对策是，我们选择最小 
化绝对残差总和。换言之，我们需要找到那个最小化绝对残 
差总和(观察值与拟合值之间的绝对距离）的系数。最小化 
方程 3. 4可得到估计量庳： 

2, I y -~ ^ I [3. 4] 

在适当的模型假设下，当样本大小趋于无限时，我们得 
到因变量^基于2在总体水平上的条件中位数。 

当方程 3. 4实现最小化时，我们得到一条中位数回归线 
( median-regression line ) ，这一直线穿越一对数据点，使得剩 
下数据的一半位于回归线上方，另一半则在下方。也 就是： 
大概一半的残差是正的，另一半为负的。但是存在多条具有 
这种性质的回归线，只有通过最小化方程 3. 4才可得到中位 
数回归线。 
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第4节 | 算法细节 


在这一部分，我们将讲解方程 3. 4的结构如何帮助我们 
寻找实现最小化的算法。对此不感兴趣的读者可跳过本 
部分。 

图 3.4 中的左图展示了 8组假设的数据 U ,:， 乂）和28 
条 {[8(8 — 1)/2] = 28} 连结每一对数据点的直线。其中的 
虚线是拟合的中位数回归直线，即通过最小化所有数据的绝 
对垂直距离总和而得到的直线。由此观察到，存在6对数据 
点没有落在中位数回归线上，一半数据点在回归线的下方而 
另一半则位于其上方。经过平面 （ x ， 30 的每一个直线可表 
示截距 一 斜率为(/3>，择 ） 的形式 ：y = +/3 i > r ， 因此在平面 ( x ， 
W 上的直线和在平面(戽， /?,) 的点是相对应的。图 3.4 中的 
右图是(择， /?,) 的平面图，图中包括左图每条直线所对应的 
点。特别需要指出的是，中间的实心圆代表左图中的中位数 
回归线。 

此外，如果截距和斜率为 (展， /3,)的直线经过一个特定 
的点 (工, ， ： y ,)， 那么： y , =体十呙 a , 因此点(戽， 岛广落 在直线 
/3 i = (乂/工,） 一上。这样，我们在平面( X ，： y ) 上的点 
和在平面 (戽， 词）的直线之间建立了对应关系，反之亦然，这 
一现象被称为点一线二元性 ( point/line duality ) ( Edgeworth , 
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1888)。 

图 3. 4中的右图上的8条直线对应于左图上的8个数据 
点。这些直线将平面(择， /?,) 分割为一个多边形区域。这种 
区域的例子如图 3.4 阴影部分所示。在任何一个区域中，那 
些数据点对应于平面 Cr ， W 上的直线族，所有这些直线都以 
同样的方式将数据分为两个部分(即在一条直线上的数据点 
等同于另一条直线上的数据点）。因此，在方程 3. 4中我们 
设法最小化的(择，择）函数在每一个区域中都是线性的，所 
以这一函数随着一个形成多面体曲面 (polyhedral surface ) 的 
图像而凸起，正如图 3. 5从两个不同角度为我们的例子所做 
的展示一样。 



X 戸。 

图 3. 4点线两重性的图示 


这一多面体曲面的顶点、边和面分别投射出点、线段和 
区域，如图 3. 4中的右图展示的 (戽， 择）平面。利用点线二元 
性的对应性，每一个顶点对应于连结数据对的一条直线。曲 
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面上连结两个顶点的边则对应于一对这样的直线，在这里， 
定义第一条直线的其中一个数据点被另一个数据点代替，并 
且其他的数据点保持与两条直线的相对位置不变（上面或者 
下面）。 

最小化方程 3. 4中绝对距离总和的计算方法，这种获得 
中位数回归系数（兵， $) 的方法，可以建立在解决线性规划 
的外点算法 （ exterior-point algorithms ) 上。从对应于一个顶 
点的任意点(沐，译 ） 开始，沿着多面体曲面的边从顶点到顶 
点反复移动，最后选择在每个顶点处最倾斜的那条路径，直 
到实现最小化。 



图 3. S 多面体表面及其投射 


利用在之前段落中描述过的对应性特征，我们反复从由 
数据对确定的一条直线移动到另一条直线，在每一个步骤中 
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确定当前的两个数据点到底是哪一个使得方程 3. 4达到最 
小值，这个数据点就被挑选出来。绝对误差总和的最小值是 
在低于曲面最低点的(成，择）平面上的点获得的。一个涉及 
在点择上的方向导数(类似于第2章提到的，中位数是解决 
最小化问题的数值）的小小争议可得出一个结论，即中位数 
回归线之上的数据点的数目等于回归线之下的数目。 

中位数回归估计量可一般化为第 f 分位数回归的估计 
量 (Koenker d ’ Orey ， 1987)。回想第2章中的讨论，单变 
量样本^，…，％分布的第/>分位数就等于使得样本数据 
中加权距离的总和最小化的9值，这里在9值之下的数据点 
的权重为1 一 h 而在9值之上的数据点的权重为 P 。 在类似 
的情况下，我们将第 P 分位数回归估 计量以 >和於)定义为 
可最小化拟合值 $，= 把+ ^ Xi 与值: y , 之间的加权距离总 
和的数值，这里，如果拟合值低估了观察值 X ，则使用权重 
1- P ， 在其他情况下则用权重 P 。 换言之，我们设法最小化 
残差义 — y , 的总和，正向残差的权重为 f 而负向残差的权重 
为 1 — P 。 从形式上，第/>分位数回归估计量#和以 1 被用做 
最 小化： 

Yjd p (. y t , ^) = p 2 I yi I 

+ (i — p) Yj I y > 一史、 ~^ p) x . I 

[3. 5] 

这里 4 是第 2 章中介绍过的距离。因此，这一方程不 
同于方程 3. 4,在方程 3. 4中正残差和负残差被赋予同等的 
重要性，而方程 3. 5给正残差和负残差赋予不同的权重。从 
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方程 3. 5可观察，第一项的值等于位于回归线乂 = ^5^ +扩工, 
上方的数据点到该线的垂直距离的 总和； 同样，第二项则是 
回归线下方所有数据点的距离总和。 

请注意:与常见的误解不同，每一个分位数回归的系数 
估计量是基于整体样本的加权数据计算的，而非基于这一分 
位数的部分样本。计算分位数回归系数和 ^"的方法， 
可依据类似勾勒中位数回归系数的直线而发展出来。第户 
分位数估计量拥有和中位数回归估计量相似的特性:位于拟 
合线乂省〉十 打、 之下的数据比例为 P ， 而位于上方的比 
例则为 1 — P 。 

例如，当我们估计第 0. 1分位数回归线的系数时，位于 
回归线下方的观察值的权重为 0. 9,而上方的观察值的权重 
为0.1。结果，位于拟合线上方的90%数据点 ( x ,， 乂）导致了 
正残差，而拟合线下方的10%数据点拥有负残差。相反的， 
为了估计第 0. 9分位数回归的系数，赋予回归线下方的数据 
0.1 的权重，其余则为 0. 9的 权重； 因此，90%观察值拥有负 
残差而剩下的10%观察值拥有正残差。 
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第5节 | 转化与同变性 


当分析一个因变量时，研究者常常为了解释的方便或者 
获得更好的模型拟合而变换尺度。模型和估计值的同变性 
表明，如果数据被转化了，模型和估计值也会经历同样的转 
化。当我们转化因变量后，同变性的知识有助于我们重新解 
释拟合模型。 

对于因变量的任何线性转化，即在^的基础上加上一个 
常数或者乘以一个常数， LRM 的条件均值同样得到精确转 
化。这一陈述的核心在于，对于任意常数 a 和^，我 们有： 

E(c + ay I x ) — c + aE(y \ x ) [3. 6] 

例如，如果总体中每户家庭从政府那里获得 500 美元， 
总体的条件均值将同样增加500美元（新的截距将增加 
500)。如果收人的单位从1美元转化为1000美元，单位为1 
美元的条件均值同样将增加到1000倍(截距和斜率将同时 
乘以1000以改变美元的单位）。相似的，如果工资价格已经 
由美元单位转化为美分单位，那么将条件均值(截距和斜率) 
除以100将再次转化为美元单位。这一性质称为线性同变 
性 (linear equivariance ) ，因为线性转化对于因变量和条件均 
值而言是相同的。 QRM 具有同样的性质： 
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Q ( p ' (c + ay | x ) = r + a ( Q (f> [;y 丨 . r ]) [3. 7] 

这里我们假设 《 是一个正向的常数。如果 a 为负，因为顺序 
相反，所以我 们有： 

Q ' 11 ' (c + ay I J -) = <:■ 十 u ( Q ( W [: v I _ r ]) 

非线性转化是常常出现的情况。对数转化经常被用于 
处理分布的右偏态问题。为了使分布更加正态化或者获得 
更好的模型拟合，其他转化方法也会被考虑。 

为了模型协变量的相对效应（如百分比变化），对数转化 
同样被采用。换言之，协变量的效应更多地被看做倍增的而 
不是递增的。在我们的例子中,教育和种族的影响效应在之 
前表达为递增的形式(美元单位），并同样可以用倍增的形式 
测量，如以百分比变化的形式。例如，我们可以提问：当受教 
育年限增加一年时，条件均值收人的百分比是如何变化的 7 
当受教育年限增加一年时，在对数收人方程（乘以 100) 中的 
教育系数近似于条件均值收人的百分比变化。然而，在 
LRM 中，对数收人的条件均值并不等同于条件均值收人的 
对数。对收人和对数收入的 LRM 进行估计，产生以下两个 
拟合 模型： 

夕 =- 23127 + 5633 ED , logy = 8. 982 十 0. 115 ED 

从对数收人模型的结果可知，当教育增加一年时，条件 
均值收入将增加 11. 5%。[ 5 ]而受教育年限为10年时，收人模 
型中的条件均值为$33203,其对数为 8. 108。在同等教育水 
平下，对数收人模型中的条件均值则为 10. 062,这一数字大 
于收入条件均值的对数 （8. 108)。 LRM 的因变量的对数转 
化允许将 LRM 的估计值解释成百分比变化，但是绝对形式 
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的因变量条件均值不可能从对数化的条#1^均值中 获得： 

fXlog ) | i ) # log[£(：y I ; r )] 和 Ely , \ x ,] 7 ^ f KLk,K . v . kJ 

[3.8] 

尤其是，如果我们的目标是为了估计教育的绝对效应， 
我们需要选择收人 模型； 但如果是为了估计教育的相对效 
应，我们则选择对数收人模型。尽管这两个目标彼此关联， 
但是在任何简单的转化后，两种模型的条件均值并不相 
关。 [6: 因此，采用对数收人的结果对收人的分布作出结论将 
会犯错误(尽管这在实践中普遍存在）。 

对数转化是单调转化方法族中的一种，那就是维持顺序 
不变的转化。正式的，在: y < :/时，如果 / i (: y ) </ i ( y )， 那么 
转化形式 A 就是单调的。对于数值恒为正的变量而言，在常 
数必为固定的正值时，幂转化= y 也是单调的。由于 
非线性影响，当我们对因变量进行单调转化后，转化后因变 
量的变化幅度对于不同的^值是不一样的。然而方程 3. 6 
的特性只在线性函数下才正确，对于一般的单调函数则不适 
用，那就是， E ( h ( y ) I x )^ h ( E ( y , I x ,)) 0 一般而言，“单调同 
变性”的性质对于条件均值来说是不成立的，所以 LRM 并不 
具有单调同变性。 

相比之下，条件分位数具有单调同变性的 特征; 那就是 
对于一个单调函数 A ， 我 们有： 

Q p , ( h ( y ) I x ) = h ( Q p， ly I x ]) [3. 9] 

这一性质直接遵循着第 2 章中提到的单变量分位数的 
单调同变性特征。尤其是，对数 y 的条件分位数就是^的条 
件分位数的 对数： 



分位数回归横型 


Q ^ dogb ) u ) = log ( a p, [.y U ]) [3. 10] 

同样， 

Q p, (y I - r ) = f lbKl 知. [3. 11] 

因此，我们可以将非转化变量的拟合分位数回归模型重新解 
释为转化变量的分位数回归模型。换言之，假设第 P 分位数 
函数的完美拟合形式为 I x ) = A , +/?, x , 所以我们就 
有 0 ^(logy U ) = log (沐十 /3 J )， 因此，我们可以用协变量 
的绝对效应描述协变量的相对效应，反之亦然。 

以条件中位数作为 例子： 

Q °- 50) (. y , ! ED ,) =— 13769 + 4208 ED ,， C ? a 501 ( log (^) I ED ,) 
= 8. 966 + 0. 123 ED , 

受教育年限为 10 年时的收入条件中位数为28311美 
元。这一条件中位数的对数为 10. 251，近似于在同等教育水 
平下对数收人方程的条件中位数为 10. 196。相应的，当对数 
形式转变回初始形式，对数收人方程在受教育年限为10时， 
其条件中位数为， 196 = 28481。 

QRM 的单调同变性对于涉及偏态分布的研究而言是至 
关重要的。如果采用 LRM ， 原先的分布形状会在对数单位 
估计值反向转化时被扭曲，但是如果使用 QRM , 就可以维持 
原先的分布。不平等研究中经常使用百分比变化的形式来 
表达协变量对因变量的影响。因此，单调同变性可以帮助研 
究者实现两个目标 :测量 协变量的单位变化而引起的因变量 
的百分比变化以及测量这一变化对初始单位下的条件分布 
的位置和形状的影响。 
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第6节 | 稳健性 


稳健性指的 是:关 于数据 >对离群值的存在和模型假设 
的违反不敏感的一种性质。离群值被定义为违反 j 中多数 
值之间关系的一些数值。在 LRM 中，估计值受离群值影响 
较大。在前文中，我们举例说明了收人分布的离群值是如何 
扭曲均值和条件均值的。 LRM 对离群值的高度敏感性是众 
所周知的。然而，在实践中，删除离群值不能满足许多社会 
科学研究，尤其是不平等研究的需要。 

相比之下， QRM 估计值则不受离群值的影响。 m 它的稳 
健性由于最小化方程 3. 5中距离函数的性质而得到了增强， 
并且我们能够说明分位数回归估计值的特性，这类似于第2 
章关于单变量分位数的陈述。如果我们修改位于拟合分位 
数回归线之上(或之下）的某个数据点所对应的因变量的值， 
只要这个数据点依然处于回归线之上(或之下），这条拟合回 
归线将保持不变。换言之，如果我们在不改变残差的正负符 
号情况下修改因变量的值，这一拟合线将保持不变。在这种 
情况下，正如单变量分位数一样，离群值的影响是十分有 
限的。 

另外，由于估计值的协方差矩阵是在正态假设下计算得 
到的，所以 LRM 的正态假设对于获取 LRM 的推论统计值是 
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必需的。对于正态假设的违反将产生不准确的标准误。 
QRM 对分布假设的稳健性，是因为它的估计量更多地依赖 
于特定分位数附近的分布状态，而非远离分位数的分布情 
况。 QRM 的推论统计值是不受分布情况影响的（这是本书 
第4章讨论的话题）。稳健性在研究高度偏态的分布现象， 
如收人、财富、教育和健康结果时，是十分重要的。 
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第7节 | 小结 


本章介绍了分位数回归模型的基本原理，并与线性回归 
模型进行了比较，包括模型设置、估计方法和估计值的性质 
等。 QRM 延续了第2章介绍的样本分位数的许多特性。另 
外，我们还解释了 LRM 在特定情况下如何不适用于反映协 
变量对因变量分布的作用。同时，我们强调了 QRM 的一些 
关键特征，并展示了 QRM 与 LRM 之间众多重要的 差异： 
(1) 多元分位数回归对数据的拟合与一元线性回归分别对数 
据的 拟合; （2) 最小化残差绝对值的加权总和的分位数估计 
与最小化平方总和的最小二乘 估计； （3) 条件分位数对于分 
布假设的单调同变性和稳健性，而条件均值则缺乏这些特 
性。通过这些基本原理，我们可以进人关于 QRM 推论的 
话题。 
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第3章讨论了参数估计的话题。我们现在转向推论统 
计部分，尤其是 QRM 的标准误和系数估计值的置信区间。 
首先，我们综述 LRM 的推论方法，讨论有限样本情况和用于 
构建置信区间与检验假设的量的渐近分布情况。然后，我们 
介绍相应的 QRM 的渐近步骤 （ asymptotic procedure )。 接 

着，我们介绍 QRM 的自举步骤 （bootstrap procedure) -用 

于进行 QRM 系数的推论。因为关于渐近步骤的假设常常不 
能成立，所以自举步骤是更合 适的； 而且，即使这些假设得到 
满足，计算构造尺度和偏态变化的标准误也将十分复杂。自 
举步骤为获取任意估计值或估计值组合的标准误和置信区 
间提供了灵活性。本章的最后部分将讨论关于拟合优度和 
模型诊断的话题。 
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第1节 I LRM 的标准误和置信区间 

觀獅爾纖獅殲廳錢^^^»猶麵麵豬 


首先，我们综合回顾一下 LRM 系数的推论过程，在理想 
的建模假设下，其表达式为: V, = TjU^T +&，这里的误 
差 e , 服从均值为0、方差为常数/的正态独立同分布 ( i . i . d ), 
因此这种分布是可导的。表达式 表示为第 J 个协变量在 
第 i 个样本个案上的值。为了更好地进行下面的讲解，可将 
x 01 ——第 z 个个案所对应的协变量值的矢量一看做(列） 
矢量々。 

误差方差的估计量通常由 f = RSS / Ctj -^) 表示，在这 
里， RSS 表示剩余方差，而々则是拟合模型中预测变量的个 
数(包括常数项）。将预测变量值的《乂々矩阵表示为； C [因 
此第 f 列为 x u > , 即第/个个案所对应的协变量值]，回归系数 
矩阵中的最小二乘估计量$的联合分布是多元正态的，其均 
值为真实值/?，协方差矩阵为 swxr 1 。 因此，一个单独的 
系数估计量瓦服从正态分布，其均值为真实值岛，方差为 
办7 2 ,这里5,表示矩阵 ( YXr 1 的第 ； 个对角线元素 (diagonal 
entry ), 这样，我们通过私 2 估计方差反。 

非常自然的，我们通过对估计量取平方根而估计其标准 
差，并将之看做 g 的标准误(表示为％)。关于误差分布假设 
的结果是，数量 （ %—叫 服从自由度为 n —々的学生？分 
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布。这允许我们 建立这 的标准的 lOO(l-a)% 置信区间，表 
示 为良士 t oJ 2 s v 同样允许在 a 水平下通过拒绝虚无假设 H 。 ： 
A =0,如果 | 及|>匕 2 ，进而检验第 ； 个协变量是否对因 
变量有显著 影响。 

而且，这些结果对于大样本同样有效，甚至当我们放宽 
标准误的正态性假设时。如果是那样的话，数量 （ 

接近于标准正态分布。因此，上面描述的假设检验和置信区 
间，还可以用替代《分布中关键的上 a /2 点,'^表示标准 
正态分布中关键的上 a /2 点。 

表 4. 1展示了线性回归模型的拟合值结果，在这里，收 
人是两个预测变量 CED 和 WHJTf ：) 的函数。下面给出了估 
计系数，并在括号里给出了它们的标准误。例如，对于£：!)， 
它的标准误估计为98。 WHITE 的系数同样拥有一个小的 
标准误: 777。 


表 4.1 收入线性回归估计值的渐近标准误 


变 量 

收 入 

ED 

6294** 


(98) 

WHITE 

11317** 


(777) 

决定系数 

0. 16 


注： *.夕<0.01„ 
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第 2 节 I QRM 的标准误和置信区间 


我们希望对表达式为 Q w (乂 I 工 (,） =文; / fX °) 的 

;=1 

QRM 的系数/?〜进行推论。正如第3章提到的,与这个模型 
等同的表达式可写为乂 = 〜 1 f +^，这里，^拥 

有第 P 分位数为0的一般分布。正如 LRM 的情况一样，系 
数矿) 的推论是在计算的标准误％ w 的基础上，以置信区 
间或者假设检验的形式进行。这个标准误具有一个特性，即 
数量 ^] p ) -^ p ) )/ s rr 接近标准正态分布。 

正如第3章提到的， QRM 的标准误在 i . i . d 模型中是比 
较简单和容易描述的。因此，^^的渐近协方差矩阵可以 
写成： 

Sr = Mi ^-7^W (XIxr， [ 4 . 1] 

在方程 4.1 中出现的项式 / E <»(0) 代表着从误差分布的 
兔 P 分位数估计得到的误差项的概率密度。 [8] 正如在 
LRM 中，协方差矩阵是矩阵 （ X ' Xr 1 的纯量倍数 （scalar 

multiple ) o 然而，在 QRM 中，乘数 〆 】 M : 0 ) 2 代表 
基于(单变量)样本，…，上的样本分位数的渐近方 
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差。在方程 4.1 中出现的密度项是未知的，如同在单变量样 
本中一样需要被估计，而且在第2章描述的估计对应项的步 

骤可轻易地应用到现在的情境中 。 ISffi = j ~ p Q (p) ) 

可通过不同的商 ^[ Q <A> (p + / i ) — (P — /0] 估计得至 ij ， 
在这里，样本分位数 <3(/»士/1)是以拟合 QRM 模型中的残差 

$) = 乂 S 豸〜;‘），【=1，…，《为基础的。对 A 的选择比 
较微妙，凯恩克 (2005) 提出了一些可以选择的方法。 

处理非样本的情况将更加复杂。在这种情况下， 
et 不再具有共同的分布，但所有这些分布依然拥有为0的第 
f 分位数。为了处理这些非共同的分布，有必要引人矩阵 
X - X 的加权版本(下面的 D ,)。 

所有这些在 QRM 中获取渐近标准误的分析方法，始于 
凯恩克在书中提到的一般结论 (Koenker, 2005), 该书提出了 
一种适合系数估计值联合分布的多变量标准渐近法 
(multivariate normal approximation) 0 这种分布的均值由真 

实系数和协方差矩阵组成，这一矩阵的表达式为= 

拉二 又有： 
n 1 1 

D 0 = lirr^^co — ^ x (,> 'x l ,^0 D x = — Y] w,jt <,), x' 

n f~i n fzi 

[4.2] 

这里表示 1 X 6 维度下的 X 的第; 列。 而 U 和 D , 指的 
是々 X 々矩阵。加权值为叫=/^ (0) ，其中概率密度函数 
eP 5 的估值为 0( 这就是的第/>条件分位数）。这样，我们 
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可以求出表达式为 f 义的 D , 的总和，这里又是从 X 的第 Z 
列乘以而得到。在方程 4. 1趋向于正定矩阵 D ,. 的情况 
下可以给出适度宽松的条件。正如在 i . i . d 情况中一样，我 
们看到 :条件 密度函数之上的;^〜渐近分布是基于从感兴趣 
的分位数估值得到的。然而，由于不服从同分布，这些项 
式随着 i 的不同而不同，于是产生了不同的权重。由于密度 
函数是未知的，它成为估计出现在方程 4. 2中的权重 w , 的 
必须条件。计算这些权重的估计值心,的两种方法在凯恩克 
的书中有所提及。不管应用的方法是哪种，^ 〜的协 方差矩 

阵都被估算为 i = ,在 这里： 

n 1 

D。 = 丄 y^x (0/ xS^nDi = 丄 y^ / zv l x <>)t x , [4.3] 

71 i -1 n i = l 

单独的系数估计量备^的估计标准误可通过估计协方差 

八 

矩阵>2的相应对角线元素 （corresponding diagonal element ) 的 
平方根获得。如在 i . i . d 情况中，现在我们可以检验关于协 
变量对因变量影响效应的假设，并且获得分位数回归系数的 
置信区间。 

表 4. 2展示了二元变量 QRM 中第 0. 05和第 0. 95的收 
人分位数估计值的渐近和自举标准误。虽然渐近和自举的 
标准误存在一定的差异，但它们关于和效应的 
结论是相同的。在第 0. 05分位数上，的点估计为1130美 
元，标准误为36美元。而在第 0. 95分位数上，相对应的数字 
分别为9575美元和605美元。但在第 0. 05分位数上， 
WHITE 的系数等于3197美元，标准误为359 美元； 在第 
0. 95分位数上则为17484美元和2895美元。我们还可以用 
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标准误计算置信区间。 

表 4. 2收入分位数回归模型一渐近和500次重抽样自举标准误 
(500 Resample Bootstrap Standard Errors ) 


变 量 



0* 05 

0. 95 

ED 

1130 

9575 


(36) 

(605) 


[80] 

[268] 

WHITE 

3197 

17484 


(359) 

(2895) 


[265] 

[2280] 


注 :小括 号内为渐近标准误；中括号内为自举标准误。 

表 4. 2表 明:两 个极端的分位数上的和 WHITE 的 
正向效应在统计上是显著的。然而，协变量效应在不同的分 
位数上是否存在显著差异，还需要进一步检验。这些检验需 
要不同分位数上的系数的协方差矩阵。正如我们上面讨论 
过的，估计 QRM 的误差方差要比 LRM 复杂 得多； 因此，从 
多元 QRM 得到的系数协方差将会十分复杂，以至于在实践 
中不可能得到封闭解。这样，我们需要替代性的方法，来估 
计不同分位数上的系数协方差，这个话题我们将在下一个部 
分讨论。 

关于渐近标准误，更重要的担心是 i . i . d 假设通常难以 
成立。经常观察到的偏态和离群值使得误差分布背离 i . i.d 
假设。我们发现标准的大样本近似法对于 U . d 误差假设的 
微小偏离都是十分敏感的。这样，基于强参数假设之上的渐 
近程序不适合用于完成假设检验和估计置信区间 （ Koenker ， 
1994) 。不需要 i . i . d 假设的替代性方法是更加稳健和实用 
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的（如 Kocherginsky , He &. Mu , 2005) 0 为了.获得稳健的结 
果，就要求不论因变量的概率密度函数的形式是什么，其统 
计方法都是适用的，而且它的误差也是令人满意的。换言 
之，这种替代方法对因变量的分布没有前提假设。一个好的 
选择便是自举法。 
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第 3 节 | QRM 的自举法 

(Bootstrap Method ) 


可代替在之前章节中讨论的渐近法的便是自举法。自 
举法是一种蒙特卡洛 ( Mome ^ Carlo ) 方法，它用于估计参数估 
计值的抽样分布，这些参数估计值的计算依赖于来自某种分 
布的大小为 〃的 样本。当一般的蒙特卡洛模拟法被用于模 
拟抽样分布时，需要假设总体分布是已知的，大小为《的样 
本是从该总体分布中抽取的，而且每一个样本都被用于计算 
参数估计值。这些从计算得来的参数估计值的经验分布便 
被用做模拟我们想要的抽样分布。特别的，估计值的标准误 
可以通过参数估计值的样本的标准差计算得到。 

由埃弗隆 ( Efron , 1979) 引人的自举法不同于一般的蒙 
特卡洛模拟法。与从假定的分布中抽取样本不同的是，我们 
从实际观察得到的数据中采用放回抽样方法抽取大小为^ 
的样本。重新抽样的数量(用 M 表示）在估计标准差时通常 
位于50到200之间，而在估计置信区间时，则位于500到 
2000之间。尽管每一个重新抽样有着与初始样本相同的要 
素数量，但它可以多次抽取某些初始数据点，同时排除其他 
一些数据点。因此，每一个再抽样样本都随机地偏离初始 
样本。 
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为了举例说明自举法，我们来考虑在样本光，…，兄的第 
25 百分位数&°+ 23) 样本基础上估计总体第 25 百分位数 
的情况。我们想要计算估计值的标准误。一种方法是使用第 

2章提到的大样本模拟&°+ 2 ” 的方差。 这将 七 = 

、丄， ㈣ 卜的标准差的近似值， 

在这里/表示总体密度函数。由于这个密度是未知的，所以 
我们必须估计它，并且正如在本章开始部分提到的，我们可 
以通过公式 ( Q <0 ' 2 sfw - Q <, l 2 M ) )/(2^) 和选择适当的常数 A 
来估计项式 l //( Q ,n 25, ) = 

同样解决这一问题的自举法在某种程度上更加直 接:我 
们采用放回抽样方法，从初始样本中抽取大小为《的大量样 
本。 这些 样本被称为自举样本 （bootstrap sample 〉 。 对于第 
个自举样本歹<广，…，歹；；"，我们要计算值6；：' 25) 。重复大 
数 iW(50 至 200) 次抽样，将产生样本女„° 25> , m =\, M, 

我们将其视为从抽样分布& a 25) 中抽取而来的。然后，我们 
使用 0 T ' . m =\, iW 的标准差，来估计我们想要的 

标准差。 

自举估计同样用来获得目标总体第 25 百分位数的近似 
置信区间。有各种各样的方法可以达到这一目的。其中一 
种是利用样本的初始估计值 3 ( a 25) 及它的标准误100 
(1- a )% 来计算置信区间的常态近似值 仏。 ± 。 

另一种替代方法是利用自举估计样本的经验分位数。 
对于自举的 95% 置信区间，我们将区间的端点看作样本自举 
估计值的第 0. 25 和第 0. 975 分位数。更具体的，如果我们将 
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自举估计值 d 卩 25) ，…，女 °„ T 从小到大地排列数字顺序 
q ； oz5) , $=)，我们的置信区间便是[女 r )， 女 ; r ]。 
其他任何覆盖概率的置信区间都可以使用相似的方法建立。 

将这一思路扩展至 QRM , 我们希望估计分位数回归的 
参数估计值 〆 # =以〜，…，/^)的标准误，这些参数估计值 
是基于包括样本协变量一因变量数据对 Cr,， y ,)，z = l ， …， 
^的数据而计算得来的。这种匕， W 数据对的自举法，指的 
是通过对这些数据对的放回抽样而得到的大小为《的自举 
样本，数据对即微观单位(包括 a ^数据的个案）。样本中一 
个数据对的重复次数是通过他们的重复率而计算的，因此， 
一个出现了々次的数据对被抽取的概率将增加々倍。 

每一个自举样本产生一个参数估计值，而我们通过 M 自 
举估计值可以计算特定系数估计值的标准误5^。这种 
自举估计可以通过不同方式用于计算单个分位数回归参数 

的置信区间。其中一种便是利用标准误估计和正态渐近 
法： $广。或者，我们可以在样本分位数的基础上计 
算置信区间。例如 穿 ，的 95%置信区间从样本的第 2. 5百 
分位数延续至第 97. 5百分位数，这一样本包括 M 的自举估 
计值 R 。 

例如，对基于19个等距分位数 （/> = 0.05,…， 0.95) 的 
多元 QRM 可以从总体上考虑。我们可以估计19个模型中 
所有可能的分位数回归系数之间的协方差。例如，当正在 
拟合的模型包括截距参数纪和与两个协变量总和纪相对应 
的系数时，我们有 3 X 19 = 57 个被估计的系数，产生57 X 57 
协方差矩阵。这一矩阵不仅提供了在每一个分位数[如， 
V ar (^'° 5 ) 和 V ar (^°' 5 W )] 上各个协变量的系数方差，而且 



第 4 章分位数回归的推论 


还提供同一协变量[如， Cov (^ 05 ) ， Var .6 广 ）] 在不同分位 
数上的估计值的协方差。 

通过对方差和协方差的估计，我们可以通过沃德 ( Wald ) 
值进行假设检验，以验证同一协变量但不同分位数 P 和9相 
对应的一对系数和痒*是否相等。 

/ n ^' l ) yz 

WaW 值 = P \ 2 Pl — [4. 4] 

h 

分母中的是#>一式…的差的估计方差,可以通 
过下面的方程和替代方程右端的估计方差和协方差而 获得： 

Var (^7 ， -^ ,> ) = Var(f ) + Varf ^/)- 2 Cov (^ ?, , 

[4.5] 

在虚无假设下，沃德值服从自由度为 1 的卡方分布 ( x 2 )。 
更一般的，我们可以检验不同分位数上的多元系数是否 
相等。例如，假设我们拥有两个协变量和模型中的截距部 
分，我们希望检验第/>和第 g 条件分位数函数是否可以彼此 
转化 ，即： 

H 。： f =把和甿=甿与••甿美纪或者 f 

去除了截距部分。进行此类检验的沃德值可以被描述如 下:首 
先，我们利用估计的协方差来获得 gw 的一个估计协方差 

「八 八 I 

矩阵 in , 其表达式为 in = :" : 12 ，这个式子可 

L (T 21 cr 22 J 

以通过将估计的方差和协方差替换为下面的方程而 求解： 

Var (歹 /)- 贫， 

二 Var (^ ?， ) + Var (片 )） 一 2 CovC ^ f> , ^ ) 
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a 12 = 21 = Cov(^ p) , ) + Cov(^ 1 ,) , ^ ) 

— Cov (貧 n)— Cov ( 允 ) ，歹 /)) 
S 2i = Var( = Var(jS 2 <p) ) + VarC^) 

— Cov ( 忿 p> ，武 ?) ） 


下面我们计算这一检 验值: 


W = 


nr' 

t 

y— 1 




\3T 


这个方程在虚无假设下，接近于自由度为2的卡方分布 (: t 2 ) 。 

Stata 通过 bsqrcg 命令，可实现单个 QRM 的自举程序， 
而对于多元 QRM ， 则采用 sqreg 命令。从 sqreg 命令计算出 
的估计值和那些通过 bsqreg 命令得到的个别结果是一样的， 
但是 sqreg 命令会提供整个协方差矩阵。 sqreg 的实用性有 
助于研究者检验不同分位数上的系数是否相等。依靠计算 
机技术的发展，多数研究者得以使用自举法。例如，在超过 
200⑻户家庭的收人数据中的500个重新抽样样本，中位数 
上的二元 QRM 的协方差估计任务， Stata (版本 9. 2) 通过6 4 
位、 1.6 G 赫兹的处理器大概要用8分钟来完成。而拥有500 
个复制样本的19个分位数进行类似估计则需要花2个 
小时。 
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第 4 节 | QRM 的拟合优度 

■ ... .... . , . ... ■ . : 


在线性回归模型中，拟合优度由记（即决定系数) 测量： 

S , u -^) 2 S ,^-^) 2 

在方程第二项中的分子代表观察值 X 与相应的模型拟 
合值 A 的距离平方和。另一方面，分母则是观察值和拟合值 
(只从模型中的截距部分计算得来）的距离平方和。因此,记 
可被理解为在模型中因变量的差异可由预测变量解释的比 
例。这个数值落在0和1之间，记值越大，表示模型拟合 
越好。 

对于分位数回归模型，我们可以轻松地发展出类似于尺 2 
的统计值。由于线性回归模型拟合是基于最小二乘法的，而 

分位数回归模型则以最小化加权距离总和 (仝 d p ( y ,， 仙 

1=1 

为基础，正如第3章至第5章提到的——根据 x >艾还是 
y, <立而确定不同的权重——我们依据符合这一标准的方 
式来测量拟合优度。凯恩克和马沙杜 (Koenker Machado , 
1999) 建议通过比较模型中的加权距离总和与截距参数的总 
和来测量拟合优度。让表示第分位数回归完整模 
型的加权距离总和，让 V 0 (/>) 表示只包括常数项的模型的加 
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权距离总和。以单一协变量模型为例，我 们有： 

/^) = 5) = 2):)〆 , r ,P y, — tf) 

I — 1 1 

+ S .、;<,$、(1 - 々 ）I _ y . -( t ' 1 ' — W 工 , 

和 

V } ( p ) = ' Zd . iy ,, Q …） = 工 > I 乂 一 Q … I 

' - 1 X > v 

+ Ed -户） I y ，~ Q ip> I 

对于只包含常数项的模型，拟合的常数正是样本％，…， 
%的第^分位数这样，拟合优度便被定 义为： 


r p = 


V ] (p) 

Yip) 


[4.7] 


由于 V °(/>) 和 V 1 (户)是非负的為的最大值为1。同样， 
因为完整拟合模型中令加权距离总和最小化， V 1 ( p ) 永远不 
会大于 v ^^)， 所以 &大于 或等于0。因此，&的取值范围 
在0和1之间，大的值表示更好的模型拟合。方程 4. 7是 
QRM 在 p 上的拟合优度的局部测量。对于所有分布的 
QRM 的全面评估，要求对&进行整体检验。 

上面定义的 R , 允许我们对超出截距项的任意协变量拟 
合模型与只包括截距项的模型进行比较。这是由凯恩克和 
马沙杜 (1999) 为嵌套模型引进的比较拟合优度的受限形式。 
通过明显的扩展，对于特定模型拟合度的改善程度，可以通 
过模型的较大受限形式来测量。由此得到的结果被称为相 
对风值。让 W ( p ) 表示限制较小的第 p 分位数回归模型的 
加权距离总和，而让 W ( P ) 表示限制较大的第 P 分位数回归 
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模型的加权距离总和。而相对尺⑷值可表 示为： 

相对 —[4.8] 

下面我们用收人的例子进行讲解。我们在19个等距分 
位数上对收人拟合一个二元变量 QRM (教育和种族)和一个 
一元变量 QRM (只有教育）。表 4. 3中的数值分别代表常数 
模型和完整模型的拟合优度(见图 4. 1 )。 Stata 通过方程 4. 7 
提供了拟合优度的测量值，并称之为伪 （ pseudcOR 2 值，以便 
与 LRM 的常规 J ? 2 相区分。 


| — 1个协变置 --- 2个协变童1 

图 4.1 分位回归模型的拟合 优度： 

一个协变量模型嵌套于两个协变置横型 

表 4. 3列出了二元协变量模型的拟合优度。在低尾处 
的收人拟合优度要低于上尾处。收人分布中19个分位数上 
的平均风,>为0.0913。而一元协变量模型是嵌套在二元协 
变量模型中的，它在19个分位数上的平均为 0. 0857。 
这些模型的 i ? (p) 表示将种族作为解释变量会改善模型的拟 
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合。对比于一元协变量模型的 R ⑼，二元协变量模型的尺⑼ 
只有适度的增加，所以，教育拥有主要的解释力。对于添加 
种族是否显著改善模型的正式检验方法是〖比率 （ hatio )。 
对于一组解释变量的正式检验方法超出了本章的范围，感兴 
趣的读者可参考凯恩克和马沙杜的书 (Koenker & Machado , 
1999 )。 


表 4. 3收入分位数回归模型的拟合优度 


模 型 

0. 05 

0. 10 

0. 15 

0‘ 20 

0.25 

二元变量一收人 

0. 0254 

0. 0441 

0. 0557 

0. 0652 

0. 0726 

一元变量一收人 

0. 0204 

0. 0381 

0. 0496 

0. 0591 

0. 0666 

模 型 

0. 30 

0. 35 

0.40 

0. 45 

0. 50 

二元变量一收入 

0. 0793 

0. 0847 

0, 0897 

0. 0943 

0. 0985 

一元变量一收人 

0. 0732 

0. 0784 

0. 0834 

0. 0881 

0. 0922 

模 型 

0. 55 

0. 60 

0. 65 

0. 70 

0. 75 

二元变量一收人 

0. 1025 

0. 1059 

0. 1092 

0. 1120 

0. 1141 

一元变量一收人 

0. 0963 

0.0998 

0. 1033 

0. 1064 

0. 109° 

模 型 

0. 80 

0. 85 

0. 90 

0. 95 

均值 

二元变量一收人 

0. 1162 

0. 1179 

0. 1208 

0. 1271 

0. 0913 

一元变量一收人 

0. 1112 

0. 1131 

0. 1169 

0. 1230 

0. 0857 


注 :二元 变量模型包括教育和 种族; 一元变量模型只包括教育。表格内数字 
为 R —— QRM 的拟合优度测量值。 
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第5节 | 小结 


本章讨论了分位数回归模型的推论统计。 QRM 系数的 
渐近推论(标准误和置信区间）类似于 LRM 系数的推论方 
法，只要经过必要的修改，便可以正确地估计误差方差。假 
设在社会科学研究中因变量常常出现偏态分布，那么关于渐 
近推论的假定是有问题的，所以需要一种替代性的推论方 
法。自举法出色地解决了这一问题。本章介绍了 QRM 系数 
的自举步骤。自举抽样的理念是相当直观的，并且伴随着计 
算机技术的发展而变得十分实用。 

另外，本章简要讨论了与 LRM 相似的 QRM 拟合优度。 
QRM 拟合优度的测量值尺0解释了在特定分位数方程中每 
个观察值所拥有的适当权重。是容易理解的，并且对它 
的解释类似于大家熟悉的 LRM 的 K 2 。 
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在本章中，我们讨论对分位数回归估计值的解释。首 
先，我们需要解释特定分位数的分位数回归拟合。中位数回 
归中的分位数可用来追踪位置的变化。其他具体的回归分 
位数，例如，第 0. 05和第 0.95 分位数，可以用做评估一个协 
变量如何预测因变量的条件非中心位置和形状的变化。我 
们同样关注序列回归分位数的一般情况，它可以反映因变量 
分布在形状上更微妙的变化。 

我们以 LRM 估计值的解释方法开始，接着在收人不平 
等的例子中解释 QRM 的估计值。用这种方法，我们将从两 
个方面展示为什么 QRM 方法要优于 LRM 方 法：它 帮助我 
们模型化因变量分布中的非中心条件分位数及其形状变化。 
在第3章中，我们通过同一个收人样本解释各种各样的方 
法，但现在我们同时考虑教育和种族的影响。纵观全章，我 
们集中关注初始单位因变量的分析。对单调转换因变量估 
计值的解释和对因变量初始单位含义的理解将在第6章 
讨论。 
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第1节 I 参照与比较 一 


为了帮助读者理解分位数回归的估计值，我们采用参照 
与比较 （reference and comparison ) 的概念和一些关于效应量 
化的更一般的概念。参照是传统的回归术语，比较则表示在 
回归中协变量每单位增量的效应。 [9] 

在多数情况下，我们的兴趣在于进行组别间的比较。例 
如，我们希望比较受教育年限为11年的个体和那些受教育 
年限为12年的个体。或者，我们对黑人和白人的比较感兴 
趣。无论如何，我们从一组可能的协变量开始，例如，受教育 
年限为11年的所有黑人，我们将拥有这些特征的子总体设 
为参照组。然后，我们以特定方式修改其中一个协变量，例 
如，将11年教育水平改为12年，或者将黑人种族换成白人。 
那么，我们将与修改后的一组协变量相对应的子总体作为比 
较组。这两个组别比较的主要特征是修改了单个协变量，而 
保持其他协变量不变。 

当我们从一个参照组转换到一个比较组时，检验因变量 
的分布是如何变化的，有助于量化单个协变量的变化对因变 
量分布的影响效应。对于 LRM 而言,拟合系数可以理解为 
估计效应，即因变量分布的均值变化估计值，而均值的变化 
来源于一个连续型协变量的单位增量，或者虚拟变量值从0 
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到1的变化。每一种变化都可以理解为参照组和比较组在 
均值上的估计差异。对 QRM 的解释与之类似，即参照组和 
比较组在特定分位数上的估计 差异； 当其他协变量保持不变 
时，这一估计差异来自一个连续型协变量的单位增量，或者 
虚拟变量值从0到1的变化。 
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第 2 节 I 条件均值与条件中位数 


到目前为止，最容易理解的 QRM 是中位数回归模型（即 
第 0. 5 QRM ) ，它用以表达在特定预测变量下因变量的条件 
中位数，并且中位数回归模型可作为拟合条件均值的 LRM 
的一种替代方法。当两种模型试图模型化因变量分布的中 
心位置时，它们是可以做相互比较的。 

收人 LRM 的估计值在变量上是6314美元，在 
WH / Tf ： 种族上是11452美元。受教育年限每增加一年，在 
任何固定的教育水平上的收入均值将增加6314美元。由于 
线性假设的存在，对于任何固定教育水平下的家庭而言，条 
件均值的增加量是相同的。例如，受教育年限每增加1年， 
家庭的平均收人便增加相同的数量，不管户主拥有9年或16 
年教育年限。另外，教育年限每增加1年的效应，对于黑人 
和白人是同样的 ：如果 模型中没有放入种族和教育的交互 
项。就参照组和比较组而言，我们可以说，尽管存在许多不 
同的参照组/比较组的组合，但是只存在两种可能的效 应:单 
一的种族效应和单一的教育效应。 [1 ° ] 

LRM 包含一个严格的假设:从一组到下一组，收人分布 
的位移并不伴随着尺度和形状的变化。具体来说，教育的正 
向效应反映了受教育年限每增加1年时，分布向右移动的幅 
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度，而这是表现分布移动的唯一方式。相似的，收入 LRM 中 
WHITE 的系数表示从黑人的收入分布到白人的收人分布 
存在一个向右的位置移动，同样没有改变分布 形状: 黑人的 
平均收人比白人的低11452美元。 

下面我们从 LRM 转到 QRM ， 集中关注中位数回归的特 
殊例子，我们需要记住的 是：主 要差异在于我们是模型化条 
件中位数而不是条件均值。正如在第3章讨论的，中位数可 
能是一个更让人满意的测量分布中心位置的方法，尤其是当 
我们试图模型化条件分布的整体行为时。例如，这些条件分 
布可能是右偏的，这令它们的均值更多地反映了分布上尾部 
分的情况而不是中间部分的情况。作为一个具体的例子，位 
于上尾收人分位数的家庭可能对关于教育影响中位数收人 
的研究分析有着深远的影响。因此，这种分析可能反映了教 
育对条件均值的效应远大于对条件中位数的效应。 

对中位数回归系数的解释类似于对 LRM 的系数解释。 
表 5. 1给出了各种分位数回归模型的估计系数，包括中位数 
(第 0. 5分位数）回归。就连续型变量而言，系数估计值可被 
理解为预测变量每一个单位的变化对应于因变量的中位数 
的变化。 LRM 的线性和无交互项的解释结果可应用在中位 
数回归模型中。具体来说，教育水平的每一年增量对中位数 
因变量的效应对于所有种族和教育水平来说是相同的，而且 
种族变化的效应在所有教育水平上也是相同的。 

条件中位数模型中的系数是4794美元，低于条件均 
值模型的系数。这意味着增加一年的教育会让收人平均增 
长6314美元，但对总体的多数人来说，收人的增加并没有这 
么可观。相似的，在条件中位数的 WHITE 系数是9792美 
元，低于条件均值模型中相应的系数。 
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表 S .1 收入的分位数回归估计值及墓渐延标准误 



0 . 05 

0 . 10 

0 . 15 

0 . 20 

0 . 25 

0 . 30 

0 . 35 

ED 

1130 

1782 

2315 

2757 

3172 

3571 

3900 


( 36 ) 

( 41 ) 

( 51 ) 

( 51 ) 

( 60 ) 

( 61 ) 

( 66 ) 

WHITE 

3197 

4689 

5642 

6557 

6724 

7541 

8168 


( 359 ) 

( 397 ) 

( 475 ) 

( 455 ) 

( 527 ) 

( 528 ) 

( 561 ) 


0 . 40 

0 . 45 

0 . 50 

0 . 55 

0 . 60 

0 . 65 

0 . 70 

ED 

4266 

4549 

4794 

5182 

5571 

5841 

6224 


( 73 ) 

( 82 ) 

( 92 ) 

( 86 ) 

( 102 ) 

( 107 ) 

( 129 ) 

WHITE 

8744 

9087 

9792 

10475 

11091 

11407 

11739 


( 600 ) 

( 662 ) 

( 727 ) 

( 664 ) 

( 776 ) 

( 793 ) 

( 926 ) 


0 . 75 

0 . 80 

0 . 85 

0 . 90 

0 . 95 



ED 

6598 

6954 

7505 

8279 

9575 




( 154 ) 

( 150 ) 

( 209 ) 

( 316 ) 

( 605 ) 



WHITE 

12142 

12972 

13249 

14049 

17484 




( 1065 ) 

( 988 ) 

( 1 . 299 ) 

( 1790 ) 

( 2895 ) 




注:括 号内为渐近标准误。 


括号里表示的是在 i . i . d 假设下的估计值的渐近标准 
误。如果 i . u d 假设成立，教育对收人中位数的影响效应的 
标准误是92美元， r 比率为 52. 1,并且/>值小于 0. 001，这些 
证据拒绝了“教育对中位数收人没有影响”的虚无假设。 
WHITE 的系数的标准误为727美元,而且在 0. 001水平上 
具有统计显著性。 
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第3节 I 其他个别条件分位数的解释 


有时候，相对于中心位置，研究者对分布的低尾或上尾 
部分更感兴趣。关注平等性的教育政策重视提高落后学生 
的考试成绩。在2000年，39%的八年级学生的学科成绩低 
于基础水平。因此，对于教育研究者而言，第 0.39 分位数比 
均值或中位数更有意义。福利政策以低收人群体为对象。 
如果全国的贫穷率为11%，那么第 0. 11收人分位数和低于 
这一水平的分位数对于福利研究者来说，比中位数或均值更 
有意义。研究者发现工会成员身份对位于收人分布低端的 
个案比对达到均值水平的个案有更大的回报 （ Chamberlain ， 
1994)。另一方面,对于收人排在总体前10%的人群，在高名 
望的私人大学接受教育的情况更加普遍。研究有名望的高 
等教育的得益时，通常关注第90或更高的收人分位数。 

在表 5. 1中，19个分位数的 QRM 拟合系数可以用来检 
验教育和种族在不同收入分位数上的效应。 [11] 为了告知福 
利政策制定者，我们检验条件收人模型中第 0. 1和第 0. 05 
分位数上的教育和种族系数。我们发现 :在第 0. 1分位数上， 
受教育年限每增加1年，将使收人增长1782美元，在 0. 05分 
位数上，这一增量为1130 美元; 在第 0. 1分位数上，黑人和白 
人的差距为4689美元，在 0. 05分位数上，则为3197美元。对 
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右端分布的教育回报率感兴趣的研 究者^ 可以观察在第 0. 9 
和第 0. 95分位数上的教育估计值。第 0. 95分位数的系数为 
9575美元，远高于在第 0. 90分位数上的8279美元，这意味 
着有名望的高等教育对收人的贡献是不一样的。在 i . i . d 假 
设下，渐近的标准误表明教育效应和种族效应在非中心的分 
位数上是显著的。 

因为 1. i . d 是一个非常严格的假设，它假定因变量没有 
发生形状变化，我们应该采用更加灵活的标准误估计方法， 
如自举法 ( bootstrapping ) 。表 5. 2列出了基于500次再抽样 
自举程序上的二元协变量的参数点估计和标准误。自举的 
点估计与渐近估计相近，但它们在不同分位数上的变化幅度 
比渐近标准误更小，尤其是 ED 变量(参见图 5. 1和图5.2)。 
表 S . 2收入的分位数回归估计的点估计与标准误 (500 次再抽样自举法> 



0 . 05 

0 . 10 

0 . 15 

0 . 20 

0 . 25 

0 . 30 

0 . 35 

ED 

1130 

1782 

2315 

2757 

3172 

3571 

3900 


( 80 ) 

( 89 ) 

( 81 ) 

( 56 ) 

( 149 ) 

( 132 ) 

( 76 ) 

WHITE 

3197 

4689 

5642 

6557 

6724 

7541 

8168 


( 265 ) 

( 319 ) 

( 369 ) 

( 380 ) 

( 469 ) 

( 778 ) 

( 477 ) 


0.40 

0 . 45 

0 . 50 

0 . 55 

0.60 

0 . 65 

0 . 70 

ED 

4266 

4549 

4794 

5182 

5571 

5841 

6224 


( 98 ) 

( 90 ) 

003 ) 

( 83 ) 

( 103 ) 

( 121 ) 

( 125 ) 

WHITE 

8744 

9087 

9792 

10475 

11091 

11407 

11739 


( 545 ) 

( 577 ) 

( 624 ) 

( 589 ) 

( 715 ) 

( 803 ) 

( 769 ) 


0 . 75 

0 . 80 

0 . 85 

0 . 90 

0 . 95 



ED 

6598 

6954 

7505 

8279 

9575 




( 154 ) 

( 151 ) 

( 141 ) 

( 216 ) 

( 268 ) 



WHITE 

12142 

12972 

13249 

14049 

17484 




( 1 . 041 ) 

( 929 ) 

( 1350 ) 

( 1753 ) 

( 2280 ) 




注:括 号内为渐近标准误。 
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第4节 | 不同分位数系数的等值检验 


当多元分位数回归被估计时，我们需要检验那些明显的 
差异是否在统计上显著。为完成这样的检验,需要估计横贯 
分位数估计值的协方差矩阵。对协方差矩阵的估计可借助 
自举法来实现，以允许灵活的误差，并为十分复杂的渐近线 
方程提供数学解决方法。 

表 5. 3给出了点估计值、自举标准误和/>值，这些数值 
有助于检验第 P 分位数估计值与中位数估计值、第 ( 1 - P ) 
分位数估计值及第 （p + 0. 05)( p < 0. 5) 分位数估计值是否 
等价。根据这些情况，自举法给出了比渐近线法更小或更大 
的标准误。例如，在中位数收人水平上，渐近线法给出的教 
育点估计是4794美元，标准误是92美元。而自举法计算的 
相应数值分别是4794美元和103美元。但在第0, 05分位数 
上，与渐近线法相比，自举法给出了较低准确度的教育估计 
值：自 举法标准误是80美元，大于渐近标准误 (36 美元）。 

检验不同分位数估计值是否等价的沃德检验 （Wald 
Test ) 的 p 值表 明： 在我们所选的检验中，教育效应在不同的 
分位数上是有差异的。这些检验比较了当前估计值（即第 
0. 05分位数)与其他三个估 计值: 中位数估计值、与之对应的 
另一端估计值(第 0. 95分位数)和邻近的更高分位数估计值 
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表 5. 3不同收入分位数的系数等价检验 (500 次再抽样自举法} 

—- -• 





P 

值 


分位数/变量 

系数 

与中位数系 
数有无差异 

与第 (1 — /)) - 
分位数系数 
有无差异 

与第 （P + 0.05) 
分位数系数 
有无差异 

4个系数有 
无联合差异 

第 0.05 分位数 






ED 

1130** 

(80) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0.10 分位数 

3197*" 

(265) 

0. 0000 

0. 0000 

0. 0000 

0.0000 

ED 

1782** 

(89) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0.15 分位数 

4689*' 

(319) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

ED 

2315*** 

(81) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0. 20分位数 

5642*** 

(369) 

0. 0000 

0. 0000 

0. 0018 

0. 0000 

ED 

2757 " 

(56) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0.25 分位数 

6657** 

C 380) 

0. 0000 

0. 0000 

0.4784 

0. 0000 

ED 

3172"， 

(149) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0. 30分位数 

6724** 

(469) 

0. 0000 

0. 0000 

0. 0012 

0. 0000 

ED 

3571 " 

(132) 

0, 0000 

0. 0000 

0. 0000 

0. 0000 

WHITE 

第 0. 35分位数 

7541 “ 

(778) 

0. 0000 

0. 0000 

0.0142 

0, 0000 

ED 

3900** 

(76) 

0. 0000 

0. 0000 

0. 0000 

0. 0000 



')2 


分位败回归壤型 


续表 





P 

值 


分位数/变量 

系数 

与中位数系 
数有无差异 

与第 （1-/0 与第（/ > + 0 . 05 ) 
分位数系数分位数系数 
有无差异 有无差异 

4 个系数有 
无联合差异 

WHITE 

第 0 . 40 分位数 

8168 *' 

( 477 ) 

0 . 0000 

0 . 0000 

0 . 0035 

0 . 0000 

ED 

4266 

( 98 ) 

0 . ()000 

0 . 00⑻ 

0 . 0000 

0 . 0000 

WHITE 

第 0 . 45 分位数 

8744 *' 

( 545 ) 

0 . 0028 

0 . 0008 

0 . 1034 

0 . 0002 

ED 

4549 '- 

( 90 ) 

0 . 0000 

0 . 0000 

0 . 0000 


WHITE 

第 0.50 分位数 

9087 ** 

( 577 ) 

0 . 0243 

0 . 0017 

0 . 0243 


ED 

4794 ** 

( 103 ) 

— 

— 

0 . 0000 


WHITE 

9792 ** 

( 624 ) 



0.0361 



注 :括号 内为标准误，"/><0.01。 


(在 0. 10分位数）。与此相反，在我们所选的众多检验中，种 
族效应不存在统计上的差异。例如，在 0. 20分位数上的白 
人效应与在 0.25 分位数上的差异并不显著。尤其是在中位 
数之上的收人分位数的种族效应与相邻的第 （ P +0.05) 分 
位数的种族效应在统计上不存在显著差异，这一现象正好与 
教育相反，当 P 上升时•，教育效应逐渐增大。 

你同样可以验证另一个虚无假设，即对于相同的协变量 
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而言，多于两个分位数的系数是联合相等的，表 5. 3最后一 
列展示了相同协变量的四个分位数系数的联合检验结果。 
沃德检验统计值接近于自由度为3的/分布。检验结果拒 
绝了虚无假设，并且论证了四个系数中至少有两个是彼此显 
著不相等的。 
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I 分位数回归模型 


第5节 I 通过 QRM 结果 
解释形状变化 


许多社会科学研究，尤其是关于不平等的研究，不仅需 
要说明位置变化，而且要考虑形状变化，因为在很大程度上 
仅仅关注位置会让我们忽略关于组间差异的许多信息。关 
于形状特征的最重要的两个考虑是尺度(或离散)和偏态。 

一个图像的视角 

因为我们的兴趣在于预测变量如何改变因变量的分布 
形状，所以我们通过 QRM 来计算多元分位数的估计值。对 
形状效应的分析比对位置的分析要复杂得多，所以我们需要 
一个重要的权衡。一方面，因为形状分析可利用各个分位数 
的 QRM 估计值的多重集 (multiple sets ) 来实现，所以它可以 
揭示比单独使用位置效应分析更多的信息。另一方面，描述 
这些信息是比较麻烦的，需要额外的功夫。特别是对一系列 
分位数(例如:0. 05, 0. 10,…， 0. 90, 0. 95) 的回归系数的检 
验是难以处理的,所以， QRM 估计值的图像化视角成为解释 
QRM 结果的必要途径厂 

特定协变量的 QRM 系数反映了协变量的单位变化对因 
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变量分布的分位数的影响。因此，一系列分位数的系数组可 
以用来确定协变量的单位增量是如何影响因变量的分布形 
状的。我们通过图像视角来检验系数，进而凸显影响形状变 
化的效应。对于一个特定的协变量，我们描绘其系数和置信 
封闭间 （confidence envelope ) ，这里: y 轴表示预测变量的效应 
x 轴表示分位数户。 

图 5.1 提供了关于教育和种族（两者以各自的均值为 
中心）的收入分位数函数的图像。使用那些估计系数（见 
表 5. 1)，我们同样可以描绘拟合常数的图像。因为协变量 
以其均值为中心，所以常数表示在协变量均值上的拟合分位 
数函数，这可称为特殊设置 （typical setting )。 特殊设置下的 
条件分位数函数如果在中位数以下的斜率平缓而在中位数 
以上的斜率陡峭的话，那么它就是右偏的。 

ED 效应可以表示为.当种族效应维持不变，在任一教育 
水平下，教育年限每增加1年时，条件收人分位数的变化。 
教育效应是显著为正的，因为其置信封闭间并没有穿过0线 
(见厚平行线）。图 5. 1( a ) 描述了一条向上倾斜的教育效应 
曲 线:教 育年限的单位增加效应对于所有第 P 分位数数值都 
是正向的，还随着 P 的增加而稳定上升。并且这种增加速度 
在第 0.8 以上分位数有所提升。 

WHrTE 效应可以表示 为：当 教育水平保持不变时，将 
种族变量从黑人换成白人时条件收人分位数的变化幅度。 
作为白人的效应是显著为正的，因为0线远低于置信封闭 
间。与黑人相比，图 5. 1( b ) 描述了另一条向上倾斜的白人效 
应 曲线。 在第 0. 15分位数之下和第 0.90 分位数之上的斜率 
比那些位于中间分位数的斜率更加陡峭。 



分位数回归模型 


0 0 . 1 0 . 2 0 . 3 0. 4 0 . 5 0. 6 0 . 7 0 . 8 0. 9 1 

P 

( a ) 教育 



0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 

P 

( b ) 白人 



0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 

P 

( c ) 常数(特殊设置） 

图 5.1 分碴回0估计的95%置信区间渐进线(收 入) 
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分位败回归横型 


图 5. 2对应于图 5. 1，但图 5. 2的置信封闭间是基于自 
举估计得到的。我们观察到，图 5. 2中的自举置信封闭间相 
对于图 5. 1的渐近置信封闭间要更加平衡。我们从图 5. 1 
和图 5. 2可看到一个相似的形状变化模式。 

这些图像传达了与教育和种族效应相关的额外信息。 
首先，教育和种族在影响位置变化的同时，也影响着形状变 
化。如果只存在位置变化，那么增加1年的教育或将种族从 
黑人换成白人，将令所有的分位数的增量相同，从而导致 
；§〜一 户图像接近一条水平线。然而，我们观察到的则是 g … 
随着 f 而单调递增，即当时，有并且，这一 
性质告诉我们 :增加 1年教育或者将种族从黑人变成白人对 
于高收入阶层的收人效应要大于低收人阶层。这一单调性 
同样具备尺度效应，因为它表 明当/ >< 0.5 时，有— 
卜 >0。 换言之，将种族从黑人变成白人或者增加一年教育 
水平会增大因变量的单位尺度。 [12] 尽管这两个图看起来暗 
示了真实的变化将比位置和尺度变化更加复杂，但图像并不 
足以反映偏态的变化，因为偏态需要借助多元分位数来 
测量。 

现在，我们总结一下协变量对因变量效应的图像模式。 
平行线表明协变量的单位增量仅仅会影响位置 变化； 向上倾 
斜曲线表明条件因变量分布的尺度的增大，而向下倾斜曲线 
则表示尺度的减小。然而，图像的视角不足以展示偏态的变 
化。图像化提供了关于预测变量的变化是如何产生形状变 
化的一些证据。我们同样对变化的幅度和变化是否显著感 
兴趣。我们的下一个0•标是从 QRM 估计值中发展岀测量两 
类形状变化的定量方法。 
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尺度变化 

标准差是普遍使用的测量对称分布的尺度及离散程度 
的方法。然而，对于偏态分布，所选分位数之间的距离提供 
了比标准差更多的关于离散程度的有用信息。对于在0和 
0.5 之间的第分位数，我们确定了两个样本分 位数： Q (l ^ 
(第[1一/0分位数)和(第/>分位数）。第 P 分位数间 
距， IQR ( ^ = - 〜，是测量离散程度的方法。这一 

数量描述了分布中间 （1 一 2/0部分的比例范围。当/> = 
0. 25时，这一分位数间距便是四分位间距 IQR (o a) = Q <0 - 75) - 
Q < a 25) , 提供了分布中间50%的比例范围。而 p 的其他值，例 
如0.10、0.05、 0.025, 同样可用以捕捉一个分布两个尾端之 
间的离散范围。例如，使用 p = 0. 10,第分位数间距表示 
分布中间80%的比例范围。 



图 5. 3尺度变化 

图 5. 3对比了一个参照组和一个比较组的情况,它们有 
着相同的中位数 M 。 确定了 p 的数值后，我们便可以计算参 
照组的分位数间距 iqr r = ，和比较组的 m c = u c - 
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[ 分位数回归模型 


Lr „ 然后，我们通过间距的差 （ differenceiivdifferences ) IQR C — 
IQR r 测量尺度的变化。在此图中，比较组的尺度比参照组的 
更大，即存在一个正向的尺度变化。 

转向我们的应用例 子:表 5. 4展示了两个模型下不同教 
育组家庭收人分布的尺度变化，一种方法使用样本分位数， 
即分位数直接从两组样本中计算，而第二种方法利用收入 
QRM 的协变量拟合系数来实现。对于样本分位数，11年教 
育年限组的四分位间距是26426美元，12年教育年限组的则 
为34426美元。12年教育年限组的样本离散程度为8000美 
元 ，高于 11年教育年限组。这一尺度变化可以通过计算两 
组的分位数间距差 $ ( a 75> — d ( a 25) 而获得。我们看到教育年 
限从11年变成12年，四分位间距增加了 34426 - 26426 = 
8000。对其他分位数间距使用同样的方法，我们发现，对于样 
本中间的80%范围而言，其尺度增加了 15422美元，而对于 
中间的90%范围，则有19736 美元； 对于中间的95%范围而 
言，为28052美元。 


表 S .4 收入分布的尺度变 化:从 11年到12年教育年限 


分位数与 
分位数范围 

基于样本 


基于 

模型 

教育年限 = 
11 年 （ 1 ) 

教育年限 = 
12 年 ( 2 ) 

差异 
( 2 )-( 1 ) 

Qo. 025 

3387 

5229 

1842 

665 

Qo. 05 

5352 

7195 

1843 

1130 

Qo. 10 

6792 

10460 

3668 

1782 

Qo. 25 

12098 

18694 

6596 

3172 

Qo. 7S 

38524 

53120 

14596 

6598 

Qo. yo 

58332 

77422 

19090 

8279 

Qo. 93 

74225 

95804 

21579 

9575 

Qo. 975 

" 87996 

117890 

29894 

11567 
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- T* 

续表 

分位数与 
分位 数范围 

基于样本 


基于 

模型 

教育年限= 

11 年⑴ 

教育年限= 

12 年⑵ 

差 异 
( 2 )-( 1 ) 

Qo. 75 — Qo. 25 

26426 

34426 

8000 


/? 0* 75 — /? 0* 2:» 




3426 

Qo. 90 — Qo. 10 

51540 

66962 

15422 


^ 0. 90 — 0* 10 




6497 

Qo. 95 — Qo. 0b 

68873 

88609 

19736 


A 八 

/? 0* 95 — 0* 05 




8445 

Qo. 97o — Qo. 025 

84609 

112661 

28052 


0* 975 ~ jS 0. 025 
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QRM 拟合为我们提供了估计尺度变化效应的替代方 
法。这里，我们用符号表示在一个第 P 分位数回归模型 
中某个协变量的拟合系数。这一系数表示协变量的单位增 
加所导致的任何特定分位数下的数值的增加或减少。这样， 
当协变量增加一个单位时，相应的第/>分位数间距将改变 
卜一卜 的量，这里第/>尺度变化效应用 SCSW 表示。 

SCS tp) -= IQR[ P> - IQR(f = (Ql- 1 — p) — 矿 ） — (Q ( ^ P) - QT ) 
= 成’ ）—( Q { p> - Q ( r p) ) 

= ^ (1 — w — 各 ( p) (当 p <0.5) [5.1] 

如果我们拟合一个没有协变量交互项的线性 QRM ， 那 
么尺度效应便不会依赖于特定的协变量设置（参照组）。当 
SCS 〜 等于0时，便不会出现尺度变化。而负值则表明增加 
协变量数值时会减小尺度，正值则指示相反的效应。 

使用方程 5. 1和表 5. 2的估计值，随着教育年限增加1 
年，总体中间50%部分的尺度变化是3426美元(将第 0. 75分 
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位数的系数减去第 0. 25分位数的 系数： 6598-3172 = 3426)。 
为什么这一尺度变化会小于观察到的尺度变化 (8000 美元） 
呢？这里有两方面的原因。基于模型的测量是控制了其他 
协变量(这里指种族)的部分测量。另外，基于样本分位数的 
尺度变化，是从两个特定教育组计算得到的，而基于模型的 
测量则考虑了所有教育组的情况。通过方程 5. 1，我们可以 
将教育的 QRM 系数解释为总体的中间80%部分的尺度增 
加6497美元，中间90%部分则增大8445美元，而中间95% 
部分的增长幅度为10902美元(见表 5. 4最后一列）。 

我们可以用相同的方式从尺度变化上解释种族效应。 
在表 5. 2中，控制了教育后，白人的收人离散幅度比黑人的 
更大 :对总 体中间50%部分而言，为12142 — 6724 = 5418,中 
间80%部分为 14049 -4689 = 9360,而中间90%部分则为 
17484 - 3197 = 14287。 

当保持原来的偏态不变时，尺度的变化可能成比例地伸 
展或者缩小位于中位数之上或之下的分布部分。而当原来 
的偏态发生变化时，它同样可以不成比例地伸展或者缩小位 
于中位数之上或之下的分布部分。而方程 5.1 无法区别成 
比例和不成比例的尺度变化。 

偏态变化 

一个与更大偏态相关的不成比例的尺度变化，表明存在 
对因变量分布形状的附加效应。第2章提出了直接测量分 
位差偏态 (quantilVbaYed skewness ) 的方法，即 QSK , 定义为 
上位离散幅度与下位离散幅度的比率的值减去 1( 见方程 
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2.2)。如果 QSK 大于0,分布为右偏，反之亦然。图 3. 2中 
关于教育组和种族组的箱线图表明上位离散情况与下位离 
散情况的不对称。表 5. 5的中间部分（分位数排列）的第1 
列和第2列分别描述了 11年和12年教育年限组的上位和下 
位离散情况。我们可以看 到:两 个教育年限组在样本中间的 
50%、80%, 90%和95%部分都存在右偏的收人分布。 

当我们检验比较组的偏态是否不同于参照组的偏态时， 
我们需要寻找不成比例的尺度变化 。图 5. 4描述了假设情 
境下关于右偏分布的一种不成比例的尺度变化。让地和 
M c 分别表示参照组和比较组的中位数。参照组的上位离散 
为 M R ，而比较组的则为队一格。参照组的下位离散为 
M k - L k , 而比较组的则为 M r — L r 。 不对称性可通过 （认一 
岭)/([^-峰）和(]\^ — L r )/( M K - L K ) 的比率得到。如果 
这一比率的比值等于1，即不存在偏态变化。如果它小于1， 
那么右偏的幅度在减小。如果它大于1，则意味着右偏的幅 
度在增大。以百分率表示的变化可通过将这一比率减去1 
而获得，我们称之为偏态变化 . s / h / Y ) ，或者 SKS . 



下面看一下表 5. 5中的样本 SKS ——11年教育年限组 
和12年教育年限组的偏态变化。尽管我们从上一部分内容 
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了解到高教育年限组的尺度大于低教育年限组，但是高教育 
年限组的右偏程度相对较低，因为样本中间50%部分的 
SKS 是一 0. 282,中间80%部分为一 0. 248,中间90%部分为 
-0. 283,中间95%部分为一 0. 195。因此，各种分位数范围 
的偏态程度的降低幅度在一 19. 5%和一 28. 3%之间。 

我们的任务是利用 QRM 系数获得基于模型的 SKS , 它 
涉及参照组的条件分位数。我们将有代表性的协变量组确 
定为参照类(估计常数5)。总体中间的100(1-2^)%部分 
的 SKS 为: 



八（卜广〉 /N (0. 0 ) 

a _ a 

-S<o. 5)_|_ r,) _ n(p> _ 

八 （0. 「《> A Cp ) 

a — a 


[5.2] 


表 5. S 收入的偏态变 化:增 加一年教育年限的分布情况 




基于样本 



基本模型 


分位数 

分位数 分位数 

(ED = 11KED - 12) 

SKS(p) 

QRM 

y\ 

P 

QRM 

/\ 

SKS … 

0.025 

3387 

5229 

— 0. 195 

665 

6900 

-0. 049 

0. 05 

5352 

7195 

— 0. 283 

1130 

9850 

一 0. 047 

0. 10 

6792 

10460 

-0. 248 

1782 

14168 

-0. 037 

(X 25 

12098 

18694 

— 0. 282 

3172 

24932 

-0. 016 

0. 50 

20985 

32943 


4794 

42176 


0. 75 

38S24 

53120 


6598 

65745 


0. 90 

58332 

77422 


8279 

94496 


0. 95 

74225 

■* &&804 


9575 

120104 


0. 975 

87996 

117890 


11567 

150463 
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续表 


分位数 


基于样本 基本模型 

分位数 分位数 QRM QRM 

(ED = 11KED = 12) ‘ § a 


SKS { p ) 


分位数范围 



Qo. 7 r - 

— 'Qo. r.o 

17539 

20177 

Qo. 50 

— Qo. 2 、 

8887 

14249 

Q(). [ID 

一 Q(). r “） 

37347 

44179 

Q >. r.i) 

— Qti. i' 

14193 

22483 

Qo. .； 

— Qo, 5<| 

53240 

62861 

Qo. r 

一 Ql). ： r 

15633 

25748 

Q .. 9: 

—Q ' v 

67011 

8.1947 

Q\ " 

~ Q(,. i'2o 

17f>98 

27714 


注 ：基于 样本的 SKS ' 1 '' - [(Q； 1 - a -^)/( Q ^ p ' — — 

QiT)] — 1 

对于总体的中间 50 %部分，我 们有： 

SKS o^：.> = [(Q；： 1 - 7 ^ -Q ； «- 5, )/(Q^ 75J -q^ :,, >] 

/[(dr M >/(Qr—f )] — 1 

=[20177/17539]/[14249/8887] 

- [1. 150 603] - ] 

= -0. 283 

基: P 模型的偏态变 化是： 

sks : 1 - [( f r : …十心‘ 1 )/(^ n ~ pi — )]/ 

[( 多 r, 」+ pn 卜 - ^ ，P> )/(.^ UK ^~ ^ lp, )]- l 

对 r •总体的中间 50% 部分•我 们有： 

SKS !l '-- y ' = [(^ fn - rr,, -h^ ,a751 - f‘ 5, )]/ 

[( 及 … . 、>十 f ⑺. 「>) — 貧 (a _ ^.to. 2 F,) )/( Q - … . 2S> ) ] — 1 

=[(6598 + 65745 - 4794 - 42176)/(65745 - 42176)]/ 
[(4794 + 42176 — 3172 — 24932)/(42176 — 24932)] — 1 
=^25373.'23569 ]/[18886/17244] - 1 
=:1. 0771.X 094] —1 
■ - 0. 016 


需要注意的是，因为我们求两个比率的比值，所以 SKS 
有效地排除了成比例尺度变化的影响。当 SKS = 0时，表明 
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不存在尺度变化或者成比例的尺度变化。这样， SKS 可以测 
量在成比例尺度变化之上和之外的偏态程度 。 SKS < 0表示 
由于解释变量的影响而导致右偏程度的减小 , SKS >0 则表 
明右偏程度的增大。 

表 5. 5的右边部分（模型部分）展示了教育的估计系数 
($), 典型协变量组的估计常数 （ S ) 和基于模型的 SKS 。 从 
所有四个被选的 SKS 来看,教育年限增加1年，会轻微减小 
右偏程度。变化百分比的减小范围在一 1.6%和 一4. 9%之 
间。这些基于模型的估计值远小于基于样本的 SKS ， 因为基 
于模型的教育净效应是来自典型协变量设定的一种变化，即 
控制了种族效应。 

对于白人组而言，其条件收人的偏态较小（见表 5. 6): 
总体的中间50%部分的 SKS 为 一6. 6%,中间80%部分为 
一 8. 5%,中间90%部分为一 8. 7%,而中间95%部分则为 
一 7. 6%。它表示相比于总体的中间50%部分，中间80%和 
90%部分的右偏程度的减小幅度更大。这一发现表明 ：白人 
的中上阶层的收入离散程度要大于黑人的中上阶层。 


表 5. 6从黑人到白人收入分布的偏态变化(基于模型) 


P 

QRMj3 

QRMa 

SKS^ 

0. 025 

2576 

6900 

-0. 076 

0. 05 

3197 

9850 

-0. 087 

0. 10 

4689 

M168 

一 0. 085 

0. 25 

6724 

24932 

— 0. 066 

0, 50 

9792 

42761 


0. 75 

12142 

65745 


0. 90 

‘ .14049 

91496 


0. 95 

17184 

120104 


0. 975 

22092 

150463 
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至此，我们已经提出了协变量对&变量不平等程度的影 
响效应的总体评估方法，当位置、尺度和偏态的变化在统计 
上显著时，这一方法可检验这些变化的符号的组合情况 。一 
个正向而显著的位置变化表示比较组的中位数高于参照组 
的中位数。一个正向而显著的尺度变化则表示比较组的离 
散程度大于参照组的离散程度。并且，一个正向而显著的偏 
态变化表示比较组的右偏程度比参照组的大。 

如果我们将参照组编码为比较组，将比较组编码为参照 
组，我们会得到三个负的变化值。因此，这些变化的符号组 
合，我们称之为“同步” （ in - sync ) 变化，使得总体的收入分布 
更加不平等和底层的收入水平更加集中。当由一个预测变 
量产生的这三种变化是同步的时候，这一预测变量经由位置 
和形状变化等两方面加剧了不平等的程度。如果这些变化 
的符号是不一致的，则说明预测变量对因变量的位置和形状 
的改变是朝着相反的方向进行的，并且预测变量对因变量不 
平等程度的总效应被削 弱了。 我们将这种情况称为“不同 
步” 模式 （out of sync ) 。 

表 5. 7总结了我们收入例子的总体估计情况，还包括自 
举置信区间。如果这一置信区间在95%显著水平下包含了 
0值，那么我们就不能确定变化是正向的还是负向的。在表 
5 . 7中，只有一个变化统计值是不显著的（对于总体的中间 
50%部分的白人 SKS )。 

从表 5. 7可以看到，教育年限增加1年，导致了正向的 
位置和尺度变化，以及负向的偏态变化。这一模式是不同步 
的。相似的，作为白人则导致正向的位置和尺度变化，以及 
负向的偏态变化.同样表现为不同步模式。因此，这一简单 



108 


I 分位数回归模型 


的模型告诉我们，高教育年限和作为白人是与更高的收人中 
位数和更大的收入离散范围相关联的，而低教育年限和作为 
黑人的收人分布的偏态程度更大。如果这一简单模型是正 
确的，则意味着教育和种族差异都不会加剧收人不平等的程 
度。当通过“同步”或“不同步”的效应来概括 QRM 的估计情 
况时，这一例子说明了将变量进行分类的价值所在。一旦我 
们确定了涉及同步性的变量效应，如上述教育和种族变量 
时，我们就可以相当容易地判断这一变量是否对分布的不平 
等程度有所贡献。 


表 5.7 形状变化的点估计和95%置信区间:500次再抽样自举法 


变量 

位置 

(0.05) 

SCS 

(0.025-0. 975) 

SKS 

(0.025-0.975) 

SKS 

(0.05—0.95) 

SKS 

(0.10-0.90) 

SKS 

(0. 25 一0, 75) 

收人 







ED 

4794 

10920 

一 0.049 

-0. 046 

-0. 037 

-0.017 

下限 

4592 

10162 

-0. 056 

—0. 053 

-0.044 

-0.028 

上限 

4966 

11794 

-0. 041 

-0. 038 

一 0.029 

-0. 005 

WHJTE 

9792 

19027 

-0, 079 

-0. 090 

-0.088 

-0,06/ 

上限 

9474 

10602 

-0.151 

-0.147 

-0.152 

-0.136 

下限 

10110 

26712 

—0.023 

—0.037 

-0.024 

0. 005 
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第6节 | 小结 


本章提岀各种方法解释分位数回归模型 ( QRM ) 的估计 
值。除了检验协变量对特定条件分位数的效应外，例如中位 
数或更低或更高位置的分位数，我们还扩展到关于分布的解 
释。我们通过例子讲解了 QRM 估计值的图像解释和用 
QRM 估计值测量形状变化的定量方法，包括位置变化、尺度 
变化和偏态变化。家庭收人的例子说明我们可以直接利用 
QRM 的估计值来分析协变量对收人不平等的效应。 

这一章集中关注对初始单位因变量下的 QRM 的解释。 
这些解释方法可以直接应用到线性转换的因变量上。然而， 
为了得到更好的模型拟合，偏态的因变量经常需要进行单调 
转换。例如，对数转换是右偏分布最常用的一种转换方式。 
基于因变量的表现形式——是初始尺度还是对数尺度，我们 
对效应估计值会有不同的解释。另外，因为一个模型的分析 
方法用在另一个模型上可能是无效的，所以对建模方式的选 
择十分重要。由于这一原因，我们将在第6章集中讨论由因 
变量的单调转换引出的具体话题。 
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单调转换 QRM 的解释 
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当拟合回归模型时，我们常常对右偏的因变量进行对数 
转换，以保证模型假设在最低程度上被满足。对数转换是实 
用的，因为它允许以相对方式对预测变量效应进行解释。相 
似的，对左偏的因变量取平方形式(或者其他大于1的乘方) 
可使新的分布更加对称。这些非线性的单调转换虽然可以 
改善模型的拟合程度，但不可以维持原来的分布形状。当模 
型化与特定协变量的变化量相关联的位置和形状变化时，在 
初始尺度上分析这些变化比在单调转换尺度上更有意义。 
因此，为了实现对单调转换后的因变量的 QRM 进行更具实 
质意义的解释，我们需要从转换尺度系数上获得协变量在初 
始尺度上的效应。本章将通过对数转换的例子讨论两种可 
以实现这个目标的方法。这些方法可以应用于因变量的任 
何单调转换形式。 



第 6 章单调转换 QRM 的解释 


第1节 I 对数尺度上的位置变化 


我们首先从位置变化开始。模型化因变量中心位置的一 
种方法是考虑涉及教育和收人对数的条件均值模型。表 6.1 
表明教育水平每增加一年将使条件均值收入提高到 ， " s = 
1. 137个单位，即增加13.7%。表 6. 2中（中间列为 p = 0 . 5) 
与之相应的中位数拟合模型的系数则为 (). 131，这表明教育 
增加一年将使收人的条件中位数增加到 ， 1:il = 1. 140个单 
位，或者增加14%。按相对值计算，教育效应对条件中位数 
的影响更强，而以绝对值衡量，教育效应对条件均值的影响 
更强，正如第5章所示的。 


表 6.1 对数收入的经典回归估 计:教 育和种族效应 


变 愤 

系 数 

ED 

0. 128** 


(0. 0020) 

WHITE 

0. 332" 


(0- 0160) 

Constant 

10. 497“ 


(0. 0050) 


注: 括号内为渐近标准误 a Oh 


因为增加一个 百分比 的概念需要详细说明参照组，所以 
当预测变量是类型变量时.即代表组员身份时.我们要谨慎 
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选择参照类型以方便解释结果。例如，假设我们拟合了一个 
模型，将收人对数表示为关于种族（黑人/白人）的函数，用0 
表示黑人，1表示白人。我们的拟合模型 LRM (表 6. 1) 表明， 
系数 0.332 表示白人的收人高于黑人的量为， 332 = 1. 3 9 3 , 
即收人增加了 39. 3%。另一方面，如果我们采用相反的编 
码，用0表示白人，1表示黑人， LRM 的线性同变性质告诉我 
们，黑人的系数应该为一 0. 332。这里，对黑人负向系数的解 
释并不等同于收入减少 39. 3%。相反，这个量会是= 
0.717,即收入减少 28. 3%。这一点在更大数值的系数上将 
表现得更加明显。例如，在第一个模型中的系数2,表示白人 
的收人将比黑人增加639%,而在第二个模型中，系数则为 
一2,意味着黑人的收人比白人减少 86. 5%。我们必须记住 
的是，当因变量进行对数转换后，改变虚拟变量的参照组会产 
生两种不同的结果:系数改变了符号，而百分比的改变则转化 

为倒数(+ = = 0. 135和 0.135 — 1 = 0. 865)。 



第 6 章单调转换 GRM 的解释 


第2节 I 从对数单位回封初始单位 


因变量的对数转换提供了一种分析技术和方法，从而获 
得对数据更好的拟合效应和以相对形式解释估计值。 

在初始单位上的乘法计算成为对数单位上的加法计算。 
然而，对数转换后的因变量的线性函数明确说明误差项为可 
加的而不是可乘的，因此改变了原先误差项的分布。另外， 
使用对数转换有着明显的缺点，那就是它大大地扭曲了测量 
单位。在关于不平等的研究中，对数转换的效果是人为地缩 
小不平等的表现，因为它大大缩短了分布的右尾部分。尤其 
是因为我们所感兴趣的是估计处于原始单位的因变量在中 
心位置上的效应，而不是进行过对数转换的因变量在中心位 
置上的效应。 

对数转换因变量的位置移动导致了初始单位因变量的 
分布发生怎样的变化呢？这一答案取决于位置估计值的选 
择。在条件均值的案例中，对数单位的估计值无法提供关于 
初始单位下的变化信息，反之亦然。只有线性转换拥有同变 
性质，这就可以通过一个随机变量的均值来计算其转换后的 
均值。因为对数转换是非线性的，所以条件均值收人不会是 
对数收人的条件均值的指数函数，正如我们在第3章说明 
的。实际上，在根据对数收人模型的系数以绝对形式计算协 
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变量效应的过程中，不存在简易或者闭螌解的表达式。相比 
之下，中位数回归模型则适合得多。对因变量进行单调转换 
时，条件中位数亦随之转换。 

一般地说， QRM 的单调同变性质保证了对数转换因变 
量的条件分位数等同于初始单位因变量的条件分位数的对 
数形式。当这一单调同变性质在总体水平上成立时，由于对 
数转换形式的非线性特征，将估计值变回原型将复杂得多。 
麻烦的是，对于连续型变量，受协变量影响的因变量分位数 
的变化比率取决于这一协变量的真实数值。在类型变量的 
情况下，组别身份的变化效应同样取决于协变量的数值。无 
论在哪种情况下，关于协变量对因变量分位数的影响效应， 
我们必须给出一个准确的含义。我们叙述了解决这一问题 
的两种方法。第一种需要利用协变量的特定数值，我们称之 
为典型设定值 （ Typtcal-Settmg Effects ， TSE ) 。第二种是 
均值效应 （Mean Effect ， ME ) ，即在总体中所有相关个案 
上，对协变量影响条件分位数的效应取平均数。 

典型设定值 

我们对协变量在绝对形式上影响因变量的效应感兴趣， 
而处理的方式是确定协变量在典型设定数值上的效应 。一 
种相对直接的方法，是将这一典型设定值看做协变量均值的 
矢量。如果因变量的均值被表达为协变量的非线性函数，那 
么在估计其效应时，这便是一种普遍的做法。 [13] 

下面,我们以二元协变量的例子解释这一想法。从这 
里，你会了解到如何处理多元协变量的情况。用: r 表示一个 
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连续型协变量（例如，表示一个虚拟变量（例如， 
WHITE ) a 在本章节的后半部分，我们确定一个特定值 f 。 
在拟合的第分位数回归模型下，我 们有： 

Q^'Clog^ \x, d) ^ [6. 1] 

但是，常数项可被解释为在 i 二0和 V = 0的情况下，因变 
量的第 /) 分位数的一个估计值。由于协变量常常是非负的， 
所以对数值的选择不具有特殊的意义，这使得对的解释 
变得有些无趣。另一方面，如果我们将所有协变量以其均值 
为中心，然后拟合第 P 分位数回归 模型： 

Q <p, (log^ \x, d) = 把 （ x—jc)+p d P 、Ul — d) 

[6.n 

这为参数提供了有着不同解释的另一个拟 合值： 对数转 
换因变量的第 p 分位数在协变量特定数值下的一个估计 
值。其他拟合系数和彦/在方程 6. 1和方程 6. : T 中是相 
同的。 

现在思考一下：当我们修改其中一个协变量模型时，结 
果会发生什么变化，例如，我们从典型设定中将 r 增加一个 
单位，并维持其他协变量在它们的均值水平上不变。对数因 
变量的拟合第 P 分位数等于常数项和协变量: c 系数的和：对 
于 X ，为 S + 艮；对于山则为6+瓦。 

我们希望知道这些改变对初始单位因变量的影响。 
QRM 的单调同变性质告诉我们，如果我们知道对数单位因 
变量的分布的分位数，这一分位数的指数形式便是初始单位 
上的分位数。特别的，在■典型设定中（所有协变量取均值）. 
对数单位上的条件分位数的指数转换产生初始单位上的拟 
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合条件分 位数: /。相似的，在修改的协变量数值下，对数单 
位拟合的条件分位数的指数转换分别等于•和。根 
据协变量的单位变化修正过的条件分位数减去在典型设定 
下的拟合分位数，将得到该协变量在初始单位上的效应，由 
协变量均值计算得到 ：对于 A 为 e 喊 — 对于 A 则为 

— e s 。 照这样，我们可获得协变量在因变量的任意条件 
第分位数的效应。 

为了理解协变量对因变量的潜在影响，我们最好将对数 
单位系数转换回初始单位系数。如果我们打算使用渐近方 
法，我们必须采用 delta 方法 (delta method ) ，而且如果没有封 
闭解，求解过程将会十分复杂。使用分析方法来推断这些值 
是不切实际的。相反，我们采用灵活的自举法（在第5章所 
描述的)来获得这些值的标准误和置信区间。 

表 6. 3的上半部分 （ TSE ) 展示了绝对形式下的 ED 和 
WHITE 对收人的典型设定效应，由所有协变量的均值计算 
得到，和通过自举法估计得到的95%置信区间。对于中位数 
而言，当种族在平均值处保持不变时，在总体的教育平均水 
平之上增加1年，将使收人增长5519美元。将组别身份由 
黑人换成白人，保持教育在平均值处不变，将带来15051美 
元的收人增长。教育和种族的典型设定效应在低尾处比在 
上尾处更弱。这些效应比表 5. 1的结果(初始单位收人的拟 
合)更大。需要注意的是，收人模型和对数收人模型是从不 
同的拟合方式而得到的两种不同的模型。同样，典型设定效 
应的估计是基于协变量的均值，然而从拟合初始单位收人得 
来的系数适用于协变量的所有设定。 
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表 6. 3对数收入 QRM 在典型设定效应和均值效应下的 


点估计和95 %置信区间 ( 500次再抽样自 举法) 




ED 



WHITE 



效应 

a 下限 

a 上限 

效应 

a 下限 

Cl 上限 

典型设定效应 

0. 025 

660 

530 

821 

4457 

3405 

6536 

0, 05 

1157 

1015 

129 】 

4978 

4208 

6400 

0. 10 

1866 

1747 

1977 

7417 

6062 

8533 

0. 15 

2486 

2317 

2634 

8476 

7210 

9951 

0. 25 

3477 

3323 

3648 

10609 

8839 

12378 

0. 50 

5519 

5314 

5722 

15051 

12823 

17075 

0. 75 

7992 

7655 

8277 

18788 

15669 

21647 

0. 85 

9519 

9076 

9910 

19891 

16801 

22938 

0. 90 

11108 

10593 

11676 

22733 

18468 

27444 

0. 95 

14765 

13677 

15662 

28131 

21181 

34294 

0. 975 

18535 

19973 

19706 

41714 

33344 

51297 

均值效应 

0. 025 

697 

554 

887 

2719 

2243 

3424 

0.05 

1241 

1073 

1396 

3276 

2875 

3868 

0. 10 

2028 

1887 

2163 

4792 

4148 

5284 

0. 15 

2717 

2514 

2903 

5613 

5007 

6?82 

0. 25 

3799 

3620 

4008 

7228 

6343 

8089 

0. 50 

5965 

5716 

6203 

10746 

9528 

11832 

0. 73 

8524 

8114 

8865 

14141 

12162 

15858 

0. 85 

10082 

9581 

10559 

15429 

13362 

17329 

0. 90 

11772 

11157 

12478 

17664 

14900 

20491 

0. 95 

15754 

14476 

16810 

21875 

17207 

25839 

0. 975 

19836 

18007 

21235 

31419 

26192 

37014 


均值效应 


典型设定方法简单易行，而且提供了关于协变量单位变 
化对因变量的影响致应酌信息。然而，它仅仅考虑到协变量 
均值的改变所带来的效应。由于这一效应在协变量数值范 





第 6 章单调转换 QRM 的解释 


围内会发生变化，对特定数值的使用可 j 旨会导致事实的歪 
曲。因此，我们引进另一种可能的方法，即^相反的顺序取 
平均值 :首先 计算对于协变量每一个可能的取值，协变量单 
位变化的效应，然后对数据中所有协变量数值的效应取平均 
值。当因变量的分位数函数以非线性的形式依赖于协变量 
时，我们打算使用以上方法，例如，在方程 6. 1和方程 6. f 
中， log ( y ) 被表达为协变量的一个线性函数。相反，如果分位 
数函数是协变量的一个线性函数，那么这两种取均值的方法 
会产生相同的结果。 

对于一个连续型协变量和任意/>，我们问：如果他/她 
的: r 增加一个单位，其他协变量保持不变时.一个（随机）个 
案的第 P 条件分位数会改变多少？然后，我们对参照总体中 
的所有个体的改变量取均值。继续以二元协变量的模型为 
例，我们可以确定由于 I 的单位增量而带来的分位数变 
化为： 


< = | ^+1, d )~ Q (p) {y I x , d ) [6.2] 

并且平均的分位数变化等于 . r 的单位增量在上的均值效 
应，由 MFff 表示： 

MET = 1 ^LQ (p> (y,\x, + U d^-Q^HyAx,, d,)^ 
72 ,=] 

[6.3] 


在我们的模型，即对数收入关于教育和种族的函数中， 
教育是一个定距变量。计算方程 6 . 3 要求： 

(1) 通过 U ,，4) = 计算得 
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分位数回归模型 


到每个个案被估计的第 户 条件分 位数； 

(2) 通过 6 (p) (乂 U , + l ， c /,) 计 

算得到相应的第条件分位数，如果他/她的教育年限 
增加一年； 

(3) 求这两项 的差； 

(4) 对这些差取平均值。 

对于一个二分协变量，我们希望知道条件分位数的变 
化，当个体将他/她的组别身份从 d = 0 换成 d = 1时，保持 
其他协变量固定不变。在这种情况下，只有当 d = 0的子群 
体是相关的，因为将其他组别包括进来将同时改变其他协变 
量。这样，对于二分^而言，分位数的差异 便是： 

^ 0 ,, = Q (p) (y I x , 1 )- Q ( ^( 3 -) [6. 4] 

并且 d 的均值效应，表示为 MFff 乂 ,，等 于： 

ME ( f \ ,= 丄 2 [ Q <P> (3^. I - r . - 1)- Q w (x I 0)] 

^ ，: d ,=0 

[6. 5] 


这里表示样本中 4 = o 的个案数量。 

在我们的例子中，是一个虚拟变量。计算将被 
限制在样本的黑人 (WHITE = 0) a 步 骤是： 

(1) 通过 I x .， d , = Q )= e s，K+rx ', 计算得 

到每个黑人的第 P 条件分位数； 

(2) 通过 Q ip) (x I x ,- , d , = 1) = e d '化 ，计算 
得到相应的第 f 条件分位数，如果黑人变成了 白人； 
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(3) 求这两项 的差； 

(4) 对这些差取平均值。 


表 6. 3的下半部分 ( ME ) 展示了教育和种族的均值效应 
及它们的95%置信区间。 ED 和 WHITE 的效应都随着户 
增加。教育效应的大小与典型设定效应相似。然而， 
WH / TE 的均值效应随 p 的变化比典型设定效应要广阔 
得多。 


极微效应 


对于上述描述的典型设定效应和均值效应这两种方法， 
我们通过协变量的单位变化来量化它对因变量的效应。当 
因变量的分位数函数是协变量的一个非线性函数时，这两种 
方法都是为应付这种情况而设计的。一般而言，这种计算得 
到的效应并不与单位的大小成比例。例如，教育的单位可以 
是半年而不是一整年，并且教育年限增加半年的效应并不等 
于增加一整年教育效应的一半。另外，一些协变量可以被看 
做完全连续的。例如，在健康状况的研究中，我们可以将收 
入看做一个协变量。 

一种替代14方法是考虑协变量影响分位数的极微小的变化 
比率，那就是，通过导数代替有限的差异。例如，假设我们方程 
6. 1 的一个模型，给出 (y \ x , d )= Z ' da + Oi ，我 

们有： 
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I 分位数回归横型 


因此，使 x = f 和 d =么典型设定效应的相似体则变成 
£.Q ip,( -y U ， 心= 。 相似的，均值效应的相似体的 
形 式为： 

= 丄公 卢(〜 W / (，一 

n i=\ 
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第3节 | 对数单位系数的图解 


图 6. 1是对数单位系数的图解，分别展示了对数收人 
qrm 中教育 ( ED )， 白人 ( wmre :) 及其常数的曲线。在图 
6. 1中，典型设定下对数收人的条件分位数函数拥有类似于 
正态分布的分布形状，因为其中位数以上和以下的斜率是相 
近的。这一发现表明对收人作对数转换缩短了右尾分布，使 
得经过转换的分布接近于正态分布。由于对数系数可被理 
解为百分比的改变，一条水平直线应该表明不发生偏态变化 
情况下的纯单位转变。任何非水平的曲线要么表示偏态变 
化,要么表示纯位置变化，但它无法告诉我们确切的是哪一 
种变化。我们观察到和曲线是非水平的，所以 
我们知道它们的效应不纯粹是单位的改变。 

然而，我们并不确定这些曲线是表示纯位置的变化还是 
意味着另外的偏态变化。如果非水平曲线的不确定性是基 
于对数单位系数的，那么在初始单位上重新计算协变量的效 
应来分析形状的变化便十分重要。相比之下，基于绝对效应 
的曲线图可以告诉我们，协变量是否同时导致位置和单位的 
变化，以及是否会引起偏态变化。例如，采用典型设置效应 
( TSE )， 我们可以检视协变量在改变因变量形状方面的 
作用。 
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为了同时捕捉位置和单位的变化，图 6. 2展示了对数收 
人 QRM 中绝对形式下的 ED 和 WH / TE 的 TSE 以及它们 
的置信封闭间。 TSE 的图像形状与图 5.1 的十分相似 。 ED 
和 WHITE 都对位置变化、单位变化和可能存在的偏态变化 
有影响。 



U ) 教育 



(b ) 白人 

图 6. 2从收入对数 QRM 得到的 TSE (绝 对数) 的图形显示 
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第4节 | 从对数单位拟合 
测量形状变化 


因为在初始单位下我们更容易解释形状变化.所以最佳 
的方法是从对数单位系数中计算初始单位下的形状变化。 
根据单位变化方程 5. 1和偏态变化方程 5. 2,参照组的尺度 
和偏态情况是进行比较所必须的。当对初始单位的因变量 
进行拟合时，这些系数就失去了任何参照。然而，当对对数 
单位的因变量进行拟合时，协变量的数值变化所带来的效应 
是与不同的参照组相关联的。因此，当对对数单位的因变量 
进行拟合时，我们需要一个固定的参照组，以便理解形状的 
变化情况。典型设定效应可以很好地达到这一目标。将表 
6. 3的 TSE 结果代人方程 5. 1和方程 5. 2中，我们通过自举 
再抽样样本计算出尺度变化、偏态变化和它们的置信封闭 
间，如表 6. 4上半部分所示。 ED 和在 Q au25 到 
Qam 的范围内都具有正向的尺度变化效应，和在 a 25 到 
Qo . 75 ， Q 。. I 。 到 Qa 9。 ， Q ). 。5 到 Q 。. ％ ， Q 。. 。25 到 Q ». 975 的范围内具有 
负向的偏态变化效应。而这些测量值的95%置信区间表明 
和的 SKC 是显著的，但是 ED 在四种分位数差 
中的 SKC 都是显著的，而 WH / TE 只有在两种情况下 SKC 
才是显著的。由于这些测量值是在协变量的均值处估计得 
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到的，而且对数收人模型不同于收人模型，所以这些测量值 
的大小并不等于第5章中提到的那些测量值。但是，我们认 
为:这 些变化值的符号和总体的效应模式应该保持一致。不 
管是对收入还是对数收入进行拟合，与每一个协变量相联系 
的位置和形状的变化并不是同步的。 


表 6. 4对数收入的经典回归估计(教育和种族 效应) 


变量 

SCS 

(0.025-0. 975) 

SKS 

(0. 025-0.975) 

SKS 

(0.05-0.95) 

SKS 

(0.10-0.90) 

SKS 

(0.25-0.75) 

典型设定效应 

ED 

17861 

-0.016 

-0.017 

—0.025 

^0. 015 


16325 

-0.028 

-0.029 

-0.036 

-0. 029 

下限 

19108 

—0.006 

-0. 006 

-0. 014 

0. 002 

WHITE 

37113 

-0.010 

-0.118 

-0.111 

-0. ()90 

下限 

29014 

—0.129 

— 0.194 

-0.193 

-0. 199 

上限 

46837 

0.054 

- 0.022 

一 0.015 

0,047 

均值效应 

ED 

19118 

—0. 016 

-0.014 

—0.025 

-0.015 

下限 

17272 

-0.028 

-0.030 

-0. 036 

—0.029 

上限 

20592 

-0. 006 

-0.006 

-0.014 

-0. 002 

WHITE 

28653 

-0.046 

-0. 114 

-0. 107 

-0. 084 

下限 

23501 

-0. 128 

-0. 181 

-0.175 

-0.174 

上限 

34348 

0. 042 

-0.030 

-0.026 

0. 031 


TSE 可以用来直接计算协变量对尺度和偏态变化的效 
应，而不能计算均值效应。但是，协变量对尺度变化和偏态 
变化效应的导数与均值效应的导数相似。用 S 表示形状的 
测量值(尺度或偏态）， AS 表示形状变化的测量值。对于连 
续型协变量而言, AS 的导 数是： 


AS ^ = S (p, (y I x + l , d )- S (p, (y \ x , d ) [6. 6] 
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而对于二元协变量， 则为： 

d = S 屮 （ y ， d= l)-^ p Hy, d = 0) [6. 7] 

对条件分位数的均值效应采取相同的步骤，我们可以从 
对数收入 QRM 中计算尺度变化和偏态变化的均值效应(见 
表 6 . 4 的下半部分)。教育年限增加一年导致正向的尺度变 
化，这与基于 TSE 的效果相似。 WHITE 对尺度变化有正向 
效应，而且它的大小比基于 TSE 的效应要大。而在 ME 和 
TSE 之间，教育和种族对偏态变化的效应是非常相似的。 
ME 下的总体的效应模式也不是同步的，这和 TSE 的情况 
相同。 
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第5节 | 小结 


本章讨论了 QRM 中由于因变量的非线性单调转换而出 
现的解释问题。由于 QRM 的单调同变性/我们得以重新计 
算基于因变量分布的初始单位之上的协变量效应，而这在 
LRM 中是不可获得的。虽然如此，这一重新计算需要特殊 
的方法。本章提出了两种方法。典型设定方法在计算上相 
对简单，而均值效应方法则稍微复杂一些。两种方法都涉及 
对协变量数值取平均数，但以不同的规则进行。典型设定效 
应和均值效应都是在谈论整个样本或子 样本。 研究者应该 
选择最适合特定研究问题的方法。 

下一章提供了本书所介绍的技术的一个总结，通过将它 
们应用到真实的研究问题中来阐述。在应用中，我们比较了 
1991年和2001年美国收入不平等的来源，讲述了采用 QR 
分析的动机和怎么按步骤进行，并给出了全面的 Stata 命令。 





海:: .. .二 -...y 
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在前面章节中使用的实证说明只限制在一个或两个协 
变量例子上。本章将本书的技术应用在一个特别议题 上:从 
1991年到2001年间家庭收入不平等的持续和扩大。我们的 
目标是通过具体的实证例子系统地概括本书发展出的统计 
技术。我们从美国“收人和项目参与调查 （ SIPP )” 中提取 
1991年的数据，并将之合并到之前使用的2001年数据。家 
庭收人根据2001年固定币值进行了调整。我们明确指定了 
一个精简模型，即家庭收人是五大因素 （13 个协变量）的一个 
函 数:生 命周期（年龄和年龄的平方），种族/民族（白人、黑 
人、西班牙人和亚洲人），教育（大学毕业，大学未毕业，高中 
毕业和非高中学历），家庭类型（有子女的已婚夫妇、没有子 
女的已婚夫妇、有子女的单亲母亲、单身和其他），农村居民。 
以上的说明将在本章中用到。并且我们同时拟合初始单位 
收人模型和对数转换收人模型。分析包括：（1)分别评估初 
始单位收入和对数单位收人两种模型的拟合 优度； （2) 比较 
一般最小二乘法和中位数回归的估 计值； （ 3 ) 对系数进行双 
尾 检验； （4) 用图像展示19组系数估计值及其置信 区间； 并 
且 (5) 对每一年获得每一个协变量对条件分位数的位置和形 
状变化的影响效应，并检验年代的发展趋势。 
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第1节 | 观察到的收入差别 


图 7. 1描述了种族/民族组和教育组在1991年和2001 
年的99个实际的分位数。其中最有趣的特征是与1991年 
相比，2001年每组中间的98%成员的收入分散更广。 


-大学教育 ••… 大学未毕业 
-高中毕业 --- 末接受高中教育 
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—大学教眘••…大学来毕业 
…… 高中毕业 --- 未接受高中教育 

图 7.1 分种族和教育程度的经验分位数函数 

更详细的比较需要分位数的确切数值。表 7. 1比较了 
在1991年和2001年第 0. 025分位数，中位数和第 0. 975分 
位数的家庭收入（以2001年固定币值计算），并对这些数值 
赋权，以反映总体情况。观察到的总体和每个组别的共同特 
征是: 相比于1991年，2001年的中间95%家庭的离散程度 
( QSC a ()25 ) 更大，这表明在这10年中收人的总体差别和组内 
差別在增大。 
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表 7. 1家庭收入的组别分布情况 （1991 年和2001年) 





分位数 




1991 



2001 


0.025 

0. 500 

0. 975 

0.025 

0. 500 

0. 975 

总体 

6256 

38324 

131352 

6000 

40212 

164323 

种族/民族 







白人 

6765 

40949 

135443 

6600 

42878 

172784 

黑人 

3773 

23624 

101160 

3788 

27858 

113124 

西班牙人 

5342 

28851 

114138 

5600 

33144 

119454 

亚洲人 

5241 

49354 

149357 

4800 

55286 

211112 

教育 







大学毕业 

11196 

64688 

168912 

10910 

65298 

263796 

大学未毕业 

8059 

42082 

120316 

6364 

41901 

134796 

高中毕业 

6392 

35723 

104102 

5347 

33246 

118162 

高中以下 

4918 

20827 

80603 

4408 

20319 

79515 

家庭类型 







已婚有子女 

12896 

55653 

143343 

14193 

61636 

204608 

已婚无子女 

11621 

43473 

146580 

10860 

47665 

176375 

单亲母亲 

3666 

23420 

94114 

3653 

27690 

96650 

单身 

4884 

20906 

83213 

3977 

21369 

91 S 51 

其他类型 

7301 

37896 

115069 

6600 

41580 

150123 

居住地 







城市 

6330 

40732 

137574 

6199 

42504 

174733 

农村 

6122 

32874 

111891 

5419 

33505 

118079 


在过去的10年里，白人和其他种族的差别在收人分布 
的下半部分缩小了。这一缩小可以被看做白人家庭的第 
0. 025分位数收人的减少，相比之下，黑人和西班牙人的收 
人相应得到适度的增长。在中位数和第 0.975 分位数收人 
处，亚洲人的收人比白人增长得更快，但底端 2. 5%的亚洲家 
庭收入落后于白人家庭。 

收人不平等的一个重要变化是教育对顶端部分的回报。 
当大多数大学毕业生在过去10年里获得了丰厚的收人时， 
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一半以上的非大学毕业生觉得他们的收人实际上在下降。 
特别的，相对于1991年的高中綴学者，2001年，超过 97. 5% 
的高中辍学者的收入显著下降了。 

对家庭类型的考虑——由婚姻状况和子女数量来定 
义——让我们转向另一个社会分层重新塑造收人分布的领 
域。有子女的已婚夫妇收人在增加，而单亲母亲家庭和单身 
家庭的收人变化不大。城市和农村之间的不平等及它们内 
部的不平等在这10年里得到了强化。 
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第2节 I 描述统计值 


表 7. 2展示了分析中各个协变量的加权平均数和标准 
差。我们发 现:从 1991年到2001年间的平均收人几乎增长 
了 5000美元，这一增长幅度大于之前表格中观察到的中位 
数收人的增长。对数收人的小幅增长提醒 我们: 对数转换缩 
短了分布的右尾。我们发现 :种族 /民族结构有着更大的差 
异，而总体教育水平则出现了大幅提高。然而，有子女的已 
婚夫妇家庭数量减少了，而其他类型家庭和单身家庭的数量 
相应增加了。正如在过去10年中所见的，美国继续着城市 
化和市郊化的进程。 

表 7. 2变置的描述性统计值 



1991 

2001 

iL 重 " 

均值 

标准差 

均值 

标准差 

因变置 





收人 （$) 

46168 

33858 

51460 

46111 

对数收人 

10.451 

0. 843 

10. 506 

0. 909 

年龄 

49 

17 

49 

17 

年龄平方 

2652 

1798 

2700 

1786 

协变 ft 





种族/民族 





白人 

0. 795 

0. 404 

0. 755 

0. 430 

黑人 

0. 101 

0. 301 

0. 094 

0. 292 
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续表 



1991 

2001 

重 

均值 

标准差 

均值 

标准差 

西班牙人 

0. 079 

0. 269 

0. 094 

0. 292 

亚洲人 

0. 025 

0. 157 

0. 033 

0. 177 

教育 





大学毕业 

0. 230 

0. 421 

0. 261 

0. ,139 

大学未毕业 

0. 210 

0. 407 

0. 296 

0. 457 

高中毕业 

0. 341 

0. 474 

0. 302 

0.459 

高中以下 

0. 219 

0.414 

0. 141 

0. 348 

家庭类型 





已婚有子女 

0. 330 

0. 470 

0. 287 

0. 452 

已婚无子女 

0. 224 

0.417 

0. 233 

0. 423 

单亲母亲 

0. 108 

0. 310 

0. 104 

0. 305 

单身 

0. 257 

0. 437 

0. 267 

0. 442 

其他类型 

0. 082 

0. 274 

0. 110 

0. 313 

居住地 





城市 

0. 732 

0. 443 

0. 773 

0. 419 

农村 

0. 268 

0. 443 

0. 227 

0. 419 
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第3节 | 收入调查数据记录 


收入调查数据的两个特征——只有 0. 2%家庭的收人超 
过1⑻万美元，而超过总体96%的家庭收人低于10万美元， 
使得 QRM 方法在分析上优于 LRM 方法。因此，特别富有 
的家庭的数据会严重影响 OLS 的系数估计。第二，收人调查 
对每项收人资料通常进行顶端编码 （ topcoded ) ;因此，我们 
不能直接确定家庭总收人在哪个水平上被删截。另外，不同 
年份的调查可能使用不同的顶端编码标准，这导致在清理不 
同年份的数据以用于比较时十分麻烦。分位数回归模型并 
不需要考虑这些问题，因为 QRM 具有在第3章描述的稳健 
特性。在这个例子中，我们选择两个极端点，第 0. 025和第 
0.975 分位数，这样集中于对总体中间95%个案进行建模。 
由于采用顶端编码的数据点对于拟合的第 0. 975 QRM 而言， 
倾向于出现正残差，而替代通过顶端编码得到的那些（未知） 
收人数值对 QRM 估计值的影响效应倾向于最小值。这简化 
了数据处理，因为我们可以分析调查到的所有数据点，不管 
是否被进行顶端编码。 

综观这个例子，每个协变量向其中位数集中。因此，收 
入 OLS 回归中的常数项表示总体收人的均值，而对数收入 
OLS 回归的常数项则表示对数收人的均值。对建立在中心 
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化协变量之上的 QRM 拟合模型而言，收人分位数回归的常 
数项表示在典型设定效应下的收人的条件分位数，而对数收 
人分位数回归的常数项则表示在典型设定效应下的对数收 
人的条件分位数。 
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第4节 | 拟合优度 


因为 QRM 不再作出线性回归的假设，所以初始单位收 
人可以不经过转换而直接使用。然而，如果对数转换可以提 
供更好的拟合模型，我们也愿意进行转换。因此，我们对收 
人方程和对数收人方程的拟合优度进行了比较。通过 Stata 
的 “ qreg ” 命令，我们分别在19个等距分位数处拟合不同的 
QRM (总共有 2 X 19 = 38 种拟合情况）。尽管 qreg 命令可以 
产生渐近的标准误(可能是有偏的），但我们只对拟合优度统 
计值 QRM Rs 感兴趣。表 7. 3分别展示了初始和对数单位 
因变量的 QRM Rs (见第5章的定义）。 


表 7. 3拟合优 度:初 始单位与对数收入的 QRM 




1991 



2001 


分位数 

收人 

对数收人 

差异 

收人 

对数收人 

差异 


(1) 

(2) 

(2)-(1) 

(1) 

(2) 

(2)-(1) 

0. 05 

0. 110 

0.218 

0. 109 

0.093 

0. 194 

0. 101 

0. 10 

0. 155 

0. 264 

0. 109 

0. 130 

0. 237 

0. 107 

0. 15 

0. 181 

0. 281 

0. 099 

0. 154 

0. 255 

0. 101 

0. 20 

0. 198 

0. 286 

0. 088 

0. 173 

0. 265 

0. 091 

0. 25 

0. 212 

0. 290 

0.078 

0. 188 

0. 270 

0. 083 

0. 30 

0. 224 

0.290 

0. 067 

0. 200 

0.274 

0. 074 

0. 35 

0. 233 

0. 290 

0. 057 

0. 209 

0. 275 

0. 066 

0. 40 

0.242 

0.289 

0. 048 

0.218 

0.277 

0. 059 
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续表 




1991 



2001 


分位数 

收人 

对数收人 

差异 

收人 

对数收人 

差异 


⑴ 

( 2 ) 

(2)-(1) 

(1) 

(2) 

(2) — (1) 

0. -15 

0. 249 

0. 288 

0. 039 

0. 225 

0. 276 

0. 051 

(). 50 

0. 256 

0. 286 

0. 029 

0. 231 

0. 275 

0. 044 

0. 55 

0. 264 

0. 282 

0.019 

0. 236 

0. 273 

0. 037 

0. 60 

0. 270 

0. 279 

0. 009 

0. 240 

0. 270 

0_ 030 

0, 65 

0. 275 

0. 275 

-0, 001 

0- 243 

0. 266 

0- 023 

0. 70 

0. 280 

0. 270 

-0. 010 

0. 246 

0. 262 

0. 015 

0. 75 

0.285 

0. 264 

-0. 021 

0. 249 

0. 256 

0. 008 

0. 80 

0. 291 

0. 258 

-0. 032 

0. 249 

0. 250 

0. 000 

0. 85 

0. 296 

0. 250 

一 0. 047 

0. 250 

0. 242 

— 0. 008 

0. 90 

0. 298 

0. 237 

-0. 061 

0. 252 

0. 233 

一 0. 019 

0. 95 

0. 293 

0. 213 

-0. 080 

0. 258 

0.222 

-0. 036 


一般而言，相对于初始单位，对数转换会导致对数据更 
好的模型拟合。从1991年的数据来看，在 0 <f <0.65 时, 
对数收人的 i ? 会更高 ：将近 19个分位数的2/3获得了更优 
的拟合。对2001年的数据来说，在0 < 0. 85时，对数收 

入的 i ? 更高，表明对2001年数据采用对数转换比1991年数 
据具有更强的说服力.然而，对数单位下对上尾部分的拟合 
并不好。如果我们主要关心上尾部分的变化和分层，应该使 
用初始单位收入。出于这个原因，我们将讲述两种单位下的 
分析情况。 
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第5节 I 条件均值回归与 
条件中位数回归 

招/:黎梦勞■碑 ® 擦：. . . 鞭备念■裔 


我们对条件中位数进行建模，是为了展示收人的中心位 
置与协变量的关系。相反，条件均值模型（如 OLS ) 估计的条 
件均值倾向于捕捉收入分布（右偏）的上尾情况。而中位数 
回归是通过使用 Stata 的 “ qreg ” 命令而获得的。这一命令同 
样被用在初始样本的500个自举样本上，以获得自举标准误 
(见附录2中关于计算的 Stata 命令）。 

表 7. 4列出了 2001年初始单位和对数单位收人的 OLS 
估计值和中位数回归估计值。我们期待 OLS 下的效应会强 
于中位数回归下的效应，因为上尾收人数据对 OLS 系数存在 
影响。 

收入方程中的系数是以绝对形式出现的，而对数收入系 
数则是以相对形式表示。除了一些例外，对数收人下的 OLS 
系数的绝对值比对数收入下的中位数回归系数的绝对值大。 
例如，在 OLS 结果中，相对于白人，黑人的条件均值收人下降 
了 100(^- 274 - 1) =- 24%；但这一降幅在中位数回归结果 
中则是100(， 249 7 — 1 ) =— 22 %。换言之，当控制了其他效 
应后，黑人的均值收入比白人的低24%，而黑人的中位数收 
入比白人的低22%，请注 意:我 们可以在绝对形式下确定黑 
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人对条件中位数的效应，因为 QRM 具有单调同变 性质; 但我 
们无法通过条件均值的对数单位估计值得到绝对效应，因为 
LRM 并不具备单调同变性质。稍后，我们将转向从对数收 
人方程估计值中获取绝对形式下的效应。 

表 7.4 OLS 和中位数回归 (2001 年的初始和对数 收入） 

OLS 中位数 

变量- 



系数 

标准误 

系数 

标准误 

收入 

年龄 

2191 

(84. 1) 

1491 

(51. 4) 

年龄平方 

-22 

(0. 8) 

-15 

(0. 5) 

黑人 

-9800 

(742. 9) 

-7515 

(420. 7) 

西班牙人 

-9221 

(859. 3) 

-7620 

(551. 3) 

亚洲人 

-764 

( 1369. 3) 

一 3080 

(1347. 9) 

大学未毕业 

-24966 

<643. 7) 

-18551 

(612. 5) 

高中毕业 

-32281 

<647. 4) 

-24939 

(585. 6) 

高中以下 

-38817 

(830. 0) 

-30335 

(616. 4) 

已婚无子女 

— 11227 

<698. 5) 

-11505 

(559. 6) 

单亲母亲 

一28697 

(851. 1) 

-25887 

(580. 2) 

单身 

— 37780 

(684. 3) 

-32012 

<504. 8) 

其他类型 

-14256 

(837. 3) 

— 13588 

(672. 8) 

农村 

一10391 

(560. 7) 

-6693 

(344. 1) 

常数 

50431 

(235. 2) 

43627 

(185. 5) 

对数收入 

年龄 

0. 0500 

(0.0016) 

0. 0515 

(0.0016) 

年龄平方 

— 0. 0005 

(0.00002) 

-0. 0005 

(0. 00001) 

黑人 

-0. 2740 

(0. 0140) 

-0. 2497 

(0.0145) 

西班牙人 

-0. 1665 

(0.0162) 

—0. 1840 

(0.0185) 

亚洲人 

- 0 , 1371 

(0.0258) 

-0. 0841 

(0.0340) 

大学未毕业 

-0. 3744 

(0.0121) 

一 0. 3407 

(0.0122) 

高中毕业 

— 0. 5593 

(0.0122) 

一 0. 5244 

(0.0123) 

髙中以下 

一 0. 8283 

(0.0156) 

-0. 8011 

(0.0177) 

已婚无子女 

— 0. 1859 

(0.0132) 

-0. 1452 

(0. 0124) 

单亲母亲 

一0‘ 6579 

(0.0160) 

— 0. 6214 

(0. 0167) 

单身 

-0. 9392 

(0.0129) 

一。‘ 8462 

(0.0136) 

其他类型 

一 0. 2631 

(0.0158) 

-0. 2307 

(0.0166) 

农村 

-0. 1980 

(0. 0106) 

-0. 1944 

(0. 0100) 

常数 

10. 4807 

(0.0044) 

10. 5441 

<0.0045) 
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第6节 I 收入和对数收入方程中 
QRM 估计值的图像化 


QRM 与 LRM 重要的不同 在于: QRM 估计了多组分位 
数系数。我们使用 Stata 的 “ sqreg ” 命令，同时拟合 QRM 的 
19个等距分位数（第 0.05, …，第0.95)。 “ sqreg ” 命令采用 
自举方法估计这些系数的标准误。我们确定了 500个复制 
样本以保证自举样本足够大，以得到稳定的标准误和95%置 
信区间估计值。 “ sqreg ” 命令没有从每一次自举中保存估计 
值，而仅仅展示了结果的摘要。我们对初始单位收入和对数 
转换收人都进行自举抽样。从 “ sqreg ” 得到的结果用于系数 
的图像展示。 

使用如此多的估计值，导致了在复杂性和简约性之间的 
权衡考虑。一方面，众多的参数估计值可以捕捉到分布形状 
复杂而细微的变化,而这正是使用 QRM 的一大优势。另一 
方面，这种复杂并不是没有代价的，因为我们可能面对解释 
系数估计值集合的复杂问题。因此，之前备选的 QRM 估计 
值的图像视角，便成为一个解释 QRM 结果的重要步骤。 

我们特别感兴趣的是 :协变 量效应在不同分位数上是如 
何变化的。我们根据被估计的 QRM 系数随着々的变化情况 
而绘制的图像，对于突出这些系数的趋势是十分有价值的。 
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对于初始单位系数，水平线表明系数并不随着/>变化，因此， 
协变量的特定变化对因变量分位数的影响效应对所有分位 
数而言是相同的。换言之，当所有其他协变量保持不变时， 
这个协变量的变化只引起位置的 变化: 如果这条直线在水平 
零直线之上，那么存在正向的 变化; 如果在水平零直线之下， 
那么变化是负向的。另一方面，一条非水平直线代表位置和 
尺度都发生了变化。在这种情况下，位置的变化由中位数处 
的分位数系数决定 ：正的 中位数系数表明向右的位置变化, 
负的中位数系数则表明向左的位置变化 。一 条向上倾斜的 
直线表明正向的尺度变化(尺度越来越宽）。相反，向下倾斜 
的直线表明负向的尺度变化(尺度越来越窄）。曲线中任何 
非直线的形状意味着存在更复杂的形状变化，例如，以偏态 
变化的形式。然而，这些图像既不提供确切的形状变化的分 
位数，也不提供它们的统计显著性。稍后，我们将通过形状 
变化分位数检验它们的显著性。 

为了说明如何通过图像化识别位置和形状的变化情况， 
我们在图 7.2 中仔细检验了年龄对初始单位收人的影响效 
应。因为系数和置信封闭间都大于0 ( 那条水平线），年龄对 
初始单位收人的各种分位数的效应全都是正向和显著的。 
这些年龄系数形成一条向上倾斜的、近似笔直的线，这 表明： 
年龄的增长使得收人分布的位置向右移动，而且扩大了收人 
分布的尺度。 

图 7. 3的小图展示了初始单位收人的结果。基于自举 
标准误计算得到的系数点估计和95%置信区间在 p 6 (0, 
1) 范围内被绘制成图像。图中的阴影部分表明 ：如果 它没有 
穿过零值，那么这个协变量的效应在特定分位数上是显著的。 
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0 0. 1 0. 2 0. 3 0. 4 0. 5 0. 6 0. 7 0. 8 0. 9 1 
P 

图 7. 2年龄效应 :原始 尺度的 QRM 系数和 BOOSTRAP 置信区间 （2001) 

例如，亚洲人效应在 P > 0. 45往后处是不显著的，因为置信 
封闭间在这点之后穿过了 0点。第4章总结了一些基本模 
式，它提供了关于初始和对数单位系数的位置变化和尺度变 
化的一些提示。下面将讨论我们的例子中出现的模式。 

常数值的图像是关于特定家庭收入的被预测的分位数 
函数(例如，基于所有协变量的均值而虚构的家庭收人），它 
将充当参照函数。这一分位数函数表明 :对于 特定的家庭而 
言，其收人是一个右偏分布。与没有考虑协变量的影响而从 
收人数据观察到的偏态程度相比,这一偏态更不 明显。 在这 
13个协变量中，只有“年龄’’具有正效应。总体中间的 70 % 
个案的估计收人随着年龄的增长而成比例地增加。年龄效 
应在低尾部分的比率过低，而上尾部分的比率却过高。然 
而，这种不对称性并不足以得出关于偏态的结论，因为必须 
考虑基准的偏态程度（由常数项表示）。所有其他协变量的 
效应都是负的。正如之前提到的，亚洲人效应在条件分布的 
低尾部分是显著的。这部分的曲线比较平直，表示分布的下 
半部分仅存在位置变化。另外一些协变量也存在接近平直的 
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分位数回归模型 


曲线； 例如，西班牙裔的收人低于白人，几乎在所有的分位数 
上都是相似的，这使得曲线是平直的。然而，大多数协变量 
不仅产生位置变化，而且导致显著的形状变化。 

图 7. 4是关于对数系数的图像。我们发现 :对数 转换的 
近似正态性缩短了右偏分布。因此，常数系数的图像类似于 
正态分布的分位数函数。正如第4章讨论的，对数系数以相 
对形式模拟成比例的 变化; 水平直线表示在不改变偏态的情 
况下的位置变化和尺度变化。解释任何背离水平直线的情 
况都是比较困难的，因为它可能暗示着位置、尺度和偏态变 
化的混合情形。另外，因为在对数单位情况下，高端分位数 
水平直线之上或之下的对数收人的微量变化会造成初始收 
入的巨大变化，所以在声称曲线为“接近平直” （ clasetcHlat ) 
时，我们应该谨慎。例如，三个最低教育水平组的曲线相当 
平直，但我们不会称它们为“接近平直”，因为它们在第 0. 8 
分位数之上的上尾部分是明显下降的。简言之，与初始单位 
系数的图像相比，对数系数的图像是较无效的，而且在解释 
时要更加谨慎。 
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第7节 | 非中心位置的分位数 回归： 
绝对效应 


图像视角提供了关于协变量影响条件收人分布形状的 
总的看法。我们现在仔细观察非中心位置的情况，以补充图 
像视角的不足。我们选择超出图像之外的两个刚刚检验过 
的极端 值:第 0. 025和第 0. 975分位数。为了获得初始单位 
收人在第 0. 025和第 0. 975分位数回归方程的系数标准误， 
我们可以用500个复制样本的 “ sqreg ” 命令，或者手工执行 
500个复制样本的自举法，以保存计算系数估计值的所有 
5⑻组情况。条件形状变化分位数的计算是以涉及这两个分 
位数估计值(第 0. 025和第 0. 975) 的每一个自举样本为基础 
的，所以我们在这里展示的是手工得到的自举结果。在500 
组系数估计值中，我们使用中位数作为点估计值和95%置信 
区间。如果这一置信区间没有穿过0值，那么这一系数在 

0.05 处是显著的。这些结果几乎等同于 sqreg 的结果。 

对数收人方程的估计值不是以绝对形式出现的。因为 
绝对效应对于理解协变量对分布形状的影响作用至关重 
要，所以我们需要找到绝对效应，这可在典型设定（所有协 
变量的均值)下计算得到。至于获得初始收人，我们保存了 
从自举样本中得到的500组对数单位系数。对于以自举样 
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本为基础的估计方法中的每一个协变量，我们进行如下 
处理： 


(1) 通过与常数项相加，获得协变量均值的单位增 
量下的对数条件分位数。 

(2) 分别对对数条件分位数和常数项取指数，获得 
两个初始单位下的条件分位数。 

(3) 求这两个初始单位条件分位数的差，它代表了 
从典型设定 ( TSE ) 中求得的协变量的绝对效应。 

表 7. 5展示了收入和对数收人在第 0. 025和第 0. 975分 
位数处的绝对效应。表 7. 5的上半部分数值来自收人方程。 
常数项分别表示当所有协变量取均值时第 0. 025和第 0. 975 
分位的估 计值: 最低值大约为1万美元，最高值大约为 13. 7 
万美元。 

最突出的模式是协变量数值两端的效应存在巨大的差 
距。例如，黑人的收人在第 0. 025分位数处下降了 1991美 
元，而在第 0. 975分位数处则减少了 17380美元。另外，西班 
牙人和亚洲人在第 0. 025分位数处相比于白人有显著的较 
低收人，而在第 0. 975分位数下则不存在差别。 

表 7. 5的下半部分展示了基于对数收入方程的典型设 
定效应 ( TSE )。 常数项表示在典型设定下的第 0.025 和第 
0. 975条件分位数。 TSE 系数近似于从收人方程估计得到 
的 系数。 但它们并不完全相等，因为对数收人模型的拟合优 
于收人模型，还因为对数收人方程的估计值是在典型设定下 
求得的。 
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表 7. 5尾端分位数的绝对效应 (2001 年的初始和对数收入1 


变 量 

第 0. 025分位数 

第 0. 975分位数 

系 数 

系 数 

收入模型 



年龄 

248** 

3103" 

年龄平方 

-2^ 

-29*' 

黑人 

-1991〃 

— 17380.* 

西班牙人 

一 2495.* 

-7418 

亚洲人 

一 4221" 

16235 

大学未毕业 

— 2607** 

— 105858** 

高中毕业 

-4332** 

-119924 "* 

高中以下 

-6211** 

一129464 •- 

已婚无子女 

-4761"* 

-18878" 

单亲母亲 

-10193“ 

— 50465 “ 

单身 

-12257" 

— 78570" 

其他类型 

-7734 #), 

-16876 1 * 1 * 

农村 

-943** 

-18654" 

常数 

10156" 

137561-" 

对数收入模型 



年龄 

396“ 

5409** 

年龄平方 

— 3" 

-53.* 

黑人 

— 2341** 

-28867*' 

西班牙人 

-1835** 

-8032 

亚洲人 

-3259** 

8636 

大学未毕业 

一 1916** 

-49898** 

高中毕业 

-2932** 

-57557 " 

高中以下 

-4095 1 ** 

-70006*' 

已婚无子女 

一 3149" 

-12471 "" 

单亲母亲 

-5875** 

-33219" 

单身 

— 6409*， 

— 63176" 

其他类型 

— 4382** 

一 5282** 

农村 

-938^ 

-26742“ 

常数 

8457**- 

115804** 
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第8节 I 评估影晌位置和形状 
变化的协变置效应 


QRM 估计值可以被用做精确计算协变量是如何改变条 
件分布的位置和形状的。为了完成这项估计，我们比较两个 
组:参照组和比较组。在连续型协变量的情况下，当保持其 
他协变量固定不变时，通过赋予协变量某些数值来定义参照 
组，而通过增加协变量的一个单位来定义比较组。对于二元 
协变量而言，在其他协变量保持不变时，我们将其数值从0 
换成1。为了反映初始单位的分布，所有的比较都在绝对形 
式下进行。因此，如果使用对数收人回归方程来拟合数据， 
首先要获得绝对形式下的协变量系数（如之前部分所提到 
的）。位置的变化可通过中位数的系数得到。而形状（尺度 
和偏态）的变化则是在多个系数组合的基础上获 得的。 它们 
的显著水平可通过自举方法确定。 

表 7. 6展示了 1991年和2001年收人模型的结果，位置 
变化结果在顶部，尺度变化结果在中间，而偏态变化结果在 
底部。在1991年，除亚洲人之外的所有协变量都显著地改 
变了比较组相对于参照组的位置。其中一些效应从1991年 
到2001年发生了明显的变化。亚洲人的位置变化在1991年 
是不显著的，而在2001年则显著为负，意味着白人在收人上 
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相对于少数族裔享受着绝对优势。然而，其他种族/民族组 
的位置变化是不明显的。年龄的位置变化在2001年比1991 
年变得更不重要了。这种情况同样存在于低教育水平上。 
然而，已婚有子女家庭除外的家庭类型的负向位置变化效应 
更强,正如农村变量的效应一样。 


表 7. 6条件分位数的位置和形状变 化：来 自初始单位的 QRM 


变 化 

1991 

2001 

位置变化 



年龄 

1801^ 

1501** 

年龄平方 

-169" 

_149** 

黑人 

-7878〃 

-7473** 

西班牙人 

— 8692" 

-7616-* 

亚洲人 

-1231 

-2850** 

大学未毕业 

-19173” 

-18588" 

高中毕业 

-25452" 

-24926" 

高中以下 

-32595 ■- 

-30345"' 

已婚无子女 

-9562 " 

-11501“ 

单亲母亲 

-22366 •- 

一 25862〃 

单身 

-27866^ 

-32039 " 

其他类型 

-11716" 

-13659" 

农村 

-5284*' 

-6698** 

尺度变化 



(总体中间的 9 5%) 



年龄 

3393” 

2852" 

年龄平方 

-305” 

— 272“ 

黑人 

-14617-* 

— 15378" 

西班牙人 

-3027 

-4893 

亚洲人 

11425 

20842 

大学未毕业 


— 103245〃 

高中毕业 

-49002" 

-11560 CT * 

高中以下 

-63477“ 

-123369" 

已婚无子女 

3708 

-14001 " 

单亲母亲 

— 9177 

-40290** 

单身 

-32482 " 

-66374 *" 
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续表 


变 化 

1991 

2001 

其他类型 

— 8220 

-8819** 

农村 

-9817** 

-17693" 

偏态变化 



(总体中间的95%) 



年龄 

-0. 0200** 

-0. 0195“ 

年龄平方 

0. 0003** 

0. 0002 ^ 

黑人 

0. 0242 

0. 0713 

西班牙人 

0. 2374** 

0. 1833** 

亚洲人 

0. 0395 

0. 1571 

大学未毕业 

0. 3524*， 

一 0. 8572 

高中毕业 

0. 5245** 

一 1. 0263 

高中以下 

0. 744广 

-1. 1890 

已婚无子女 

0. 4344 ** 

0. 151-1 

单亲母亲 

0. 8493** 

0. 3781 '* 

单身 

0. 5229** 

0.2184 

其他类型 

0. 1748 

0. 1714 

农村 

0. 0446 

0. 0541 


位置变化代表组间差别。正如之前对表 7. 4讨论的，中 
位数回归系数比 OLS 系数更弱。对于高度右偏的收入分布， 
中位数回归系数代表中心位置的变化，而 OLS 系数则更多地 
受到右尾的影响。通过位置变化（中位数回归），我们关于教 
育组别的发现意味着教育在位置变化方面的效应并不如文 
献中指出的那样强。对位置变化的影响，或者组间差别，只 
是10年间不平等如何变化这个故事中的一 部分; 另一部分 
则是形状变化，或者相对的组内差别。 QRM 的优势在于，它 
们区分了组间和组内的差别，增加了我们对不平等变化的 
理解。 

尺度变化是形状变化的一种类型。在3个少数族裔组 
中，只有黑人的条件收人分布范围比白人的短。黑人中95% 
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的收人范围比白人的更窄，意味着黑人群体比白人群体有着 
更高的同质性，而且种族在决定收人时具有显著性。这一尺 
度变化在2001年变得更大。同样的情况存在于3个低教育 
组别中。教育的尺度变化提供了关于在收人决定因素中教 
育重要性不断增加的一致的和精确的发 现:形 状变化而不是 
位置变化，表明教育的重要性在不断增加。 

偏态变化是形状变化的另一种类型。条件分位数偏态 
程度的增加预示着不平衡的组内差别，有利于分布顶部的成 
员。1991年的结果 表明: 许多处于不利地位的组别都经历了 
这种不平衡的组内差别，包括西班牙人、3个低教育水平组和 
处于劣势的家庭类型(单亲母亲、单身和其他类型家庭）。其 
中一些组内差异在2001年消失了，特别是在教育方面。这 
一 发现进一步反映了社会奖励大学毕业生和限制低教育群 
体中非常能干者向上流动的机制。 

表 7. 7展示了从对数收人模型中求得的初始单位结果。 
这些结果反映了生命周期中的相同趋势，种族/民族组别、教 
育组别、家庭类型和农村居住类型。不管拟合的是收人还是 
对数收入，在每一年和年代的趋势中，位置变化和尺度变化 
是相似的。偏态变化则存在一些差异。具体来说，2001年， 
低教育组的偏态程度显著减 小了； 但这一发现在对数收人模 
型上是显著的，而在收人模型上则是不显著的。当检验两种 
模型(收人和对数收人)的拟合情况时，出现这种矛盾并不奇 
怪。它们体现了两种根本上不同的模型，其中一种（对数收 
人)模型的拟合情况更优。另一方面，如果定性的结果是不 
一样的，这可能说明这些结果是不稳健的。我们需要通过观 
察协变量影响不平等程度的作用的综合评价，来决定以上情 
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况是否属实。 


表 7. 7条件分位数的位置和形状变化(来自对数单位的 QRM > 


变 化 

1991 

2⑻1 

位 置变化 



年龄 

2456〃 

1994 ** 

年龄平方 

一2.! .* 

— 20” 

黑人 

-9759** 

-8386-* 

西班牙人 

-7645" 

-6300** 

亚洲人 

— 1419 

-3146** 

大学未毕业 

-10635" 

-11012** 

高中毕业 

-14476** 

-15485" 

高中以下 

一 20891 “ 

-20892 •' 

已婚无子女 

-3879-- 

-5103"* 

单亲母亲 

15815"* 

-17506” 

单身 

- 19599** 

-21658“ 

其他类型 

-6509-- 

一 7731*- 

农村 

-4931 

-6725*" 

尺度变化 



(总体中间的95%) 



年龄 

4595** 

5008** 

年龄平方 

— 41" 

一 50*. 

黑人 

一17244 ” 

— 26509“ 

西班牙人 

-2503 

-6017 

亚洲人 

4290 

12705 

大学未毕业 

一 22809” 

— 47992** 

高中毕业 

— 32675“ 

-54434** 

高中以下 

-■14457 

-65956 - 

已婚无子女 

77 

-9264" 

单亲母亲 

-10269 

— 27272” 

单身 

一 32576“ 

-56791 ,H 

其他类型 

-7535 

— 906 

农村 

-12218" 

-25760” 

偏态变化 



(总体中间的95%> 



年龄 

-0. 0417-* 

-0. 0100 

年龄平方 

0. 0005 

0. 0002 
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续表 


变 化 

1991 

2001 

黑人 

0. 1127 

一 0. 0682 

西班牙人 

0. 2745** 

0. 1565** 

亚洲人 

-0. 0383 

0. 1469 

大学未毕业 

0. 0655 

-0. 2775〃 

高中毕业 

0. 0934 

— 0. 2027** 

高中以下 

0. 2742** 

-0. 1456** 

已婚无子女 

0. 0890 

-0. 0272 

单亲母亲 

0. 5404** 

0. 3193** 

单身 

0. 2805** 

一 0. 0331 

其他类型 

0. 0164 

0. 1640** 

农村 

0. 0012 

一 0.0740 


我们发展出对协变量影响不平等程度的作用的综合评 
价方法，它用于检验位置和形状变化符号的组合情况。 

我们只考虑显著的变化情况。对于协变量而言，在这三 
种变化中同步的符号表明协变量加剧了不 平等; 显著的符号 
的个数越多，加剧效应就越强。非同步符号则表明协变量可 
能在增加组別不平等的同时降低了组内不平等，反之亦然。 
表 7. 8中关于收人模型的左边部分表 明：在 1991年,任何一 
个协变量对不平等都不具有同步效应，但在2001年，许多协 
变量都具有这一效应。这些同步协变量包括教育组别、家庭 
类型(单亲母亲除外）和农村居住类型。右边两列展示了对 
数收人模型的相应结果。我们发 现:在 综合评价上不存在明 
显的差别。例如，教育组别在两种模型中的效应模式在1991 
年是非同步的，而到2001年则转变为同步的。因此,2001年 
的美国社会是更加不平等的，而且它的社会分层比10年前 
更多地受教育、婚姻、有否子女和农村居住的影响。 

在这个例子中，我们使用总体中95%的个案计算形状变 
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化的分位数。研究者可以根据他们的研究问题定义自己关 
心的形状变化。它可以将相应的形状变化定为总体中间的 
99%、98%、90%, 80%或者50%部分。我们将这个任务留 
给读者自己完成。 


表 7. 8协变置对不平等程度彩响效应的综合评价（系数的同步性模式> 


变 量 

收入方程 

对数收人方程 

1991 

2001 

1991 

2001 

年龄 

+ + — 

+ + — 

H - 

+ + 0 

年龄平方 

——十 

——+ 

——+ 

-0 

黑人 

-0 

-0 

-0 

-0 

西班牙人 

- 0 + 

一 0 + 

- 0 十 

- 0 + 

亚洲人 

0 0 0 

- 0 0 

0 0 0 

一00 

大学未毕业 

——+ 

-0 

-0 

— 

髙中毕业 

——+ 

-0 

-0 

— 

高中以下 

——+ 

-0 

——4- 

— 

已婚无子女 

一 0 + 

-0 

- 0 0 

-0 

单亲母亲 

- 0 + 

——+ 

- 0 + 

——+ 

单身 

——+ 

-0 

——+ 

-0 

其他类型 

- 0 0 

-0 

— 0 0 

一 0 + 

农村 

-0 

-0 

-0 

-0 






第 7 章实例： 1991年和2001年的收入不平等 
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第9节 | 小结 


最近10年收人不平等维系和扩大的根源是什么？为处 
理这一研究问题，我们使用了本书发展出的技术。首先，我 
们用第2章介绍的分位数概念进行描述性分析。对收人数 
据，我们讨论了右偏分布和顶端编码的问题，并解释 QRM 为 
什么可以和怎样共同解决这些问题。我们的分析按照第3 
章讨论的6个步骤进行 :定义 和拟合模型，评估拟合优度，计 
算参数的推论统计，图像化系数和它们的置信区间，计算位 
置和形状变化以及它们的推论统计值。我们分别描述了收 
入和对数收人模型，特别关注重建初始单位系数。在描述这 
些步骤的同时，我们通过对结果的解释，展示了用 qrm 技术 
处理研究问题时所具有的实用性。我们希望关于应用步骤 
的系统总结为实证研究提供清晰的指导。 
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附录1 I 证明 ：解决 最小化问题的 
中位数和分位数 


为了简述起见，我们假设分布函数 F 具有概率密度函数 
/。为探讨中位数为什么可被定义为最小化问题，我们可以 
写成： 


E | Y-m I = 




I y — m I f(y)dy 



I y—m I f(y~)dy + 



I y—m I f(y)dy 



(m — y)f(y)dy + {y — m)f{y)dy 


[A 1] 


如图 2. 7 b 所示，方程 A 1 是一个凸函数。实现最小化 
的解决方法是对求微分并使这一偏导方程等于0。第一 
项式的偏导数 如下： 

_^ (m — y)f(.y)dy = (w —;y)/( ： y) | 尸 „ 

~(m — y)f(y)dy 
dm 

=I f(y)dy = F(m) 
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而第二项式的偏导数 如下： 


— (y — m ) f ( y)dy =— f ( y)dy =~ (1 — F ( m )) 

O TTU V = m •/ v = m 


合并以上两个偏导数，则 有： 


| y — m I f ( y)dy = F ( m ) — (1 — F ( m )) 


2 F ( m ) — 1 


[A. 2] 


通过设定 2 F ( m ) — 1 = 0, 我们得到 F ( m ) = 1/2,即是 
中位数，来满足最小化要求。 

重复上述关于分位数的计算，与方程久2相对应的分位 
数偏导 数为： 


fE [ d ,( Y , <?)] = ( l - p ) F ( q )- p ( l - F ( q )) 

= F ( q)-p [A. 3] 

我们设定偏导数 F ( q)-p = 0 以得到 F ( g ) = p 进而满 
足最小化要求。 
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I 分位数回归模型 


附录2 I STATA 命令 


数据： dO.dta 是一个用于分析的 Stata 文件 

I . 分析初始单位收入的 Stata 命令 
第1 步:拟 合优度 

* qO.do 

* a full model 

* raw-scale income in $1000 

* OLS 

* 19 quantiles 


tempfile t 


use dO 


global X age age2 blk hsp asn scl hsg nhs mh f h sg ot rural 
* centering covariates 
sum $X 
tokenize $X 
whale i 〜= I 


egen m = mean ('l ') 
replace 'lm = 'l ' — ra 
drop ra 
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macro shift 


sum $X 


forvalues k = 1 /2 j 
reg cine $X if year = 'k ' 

I 

forvalues i = 1/19 ( 
local j = 'iS/20 

qreg cine $X if year =1, q( 1 j 1 ) nolog 

I 

forvalues i = 1/19 | 
local j = 'i 720 

qreg cine $X if year = 2, q( 'j ') nolog 


第 2 步 :500 次重复抽样的同时分位数回归 （Simultaneous 
Quantile Regressions) 

s0. do 
full model 

* sreq 19 quaniles 

* raw-scale income in $1000 
analysis for 2001 


tempfile t 


set matsize 400 
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global X age age2 blk hsp asn scl hsg nhs mh f h sg ot rural 

use cine $X year if year = 2 using do, clear 
drop year 

* centering covariates 
sum $X 

tokenize $X 

m- m mil 

while 1 〜= I 

egen m = mean ('l ') 
replace r l 1 = 'l 1 — ra 
drop m 
macro shift 

1 

sum $X 

sqregcinc $X, reps(500) q(.05 .10 .15 . 20 . 25 . 30 .35 . 40 . 45 . 50 . 55 

.60 .65 .70 .75 .80 .85 .90 .95) 

rastore b, from(e(b)) 

mstore v, from(e(V)) 

keep age 

keep if — n<ll 

save SO, replace 

第 3 步 : 基于 sO. do 的结果创建图表 

* s_m0 .do 

* matrix operation 

* 13 covariates + cons 
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* graphs for beta 's (19 QH) 

* 500 bootstrap se 

* analysis for 2001 


* for black-white graphs 
set scheme s2raono 


set matsize 400 

* 13 covariate + cons 
local k= 14 

* k parameters for each of the 19 quantiles 
local kl = V * 19 

use sO ， clear 

qui rnstore b 
qui ms tore v 

* 95%ci 

* dimension 'k 'x 1 

mat w = vecdiag(v) 
mat w = w ' 
svmat w 
mat drop w 

qui replace wl = sqrt(wl) 
rnkmat wl if _n<C = 'kl ', raat( v) 
drop wl 
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mat b = b 

mat l = b-1.96*v 
mat u= b+ 1.96 * v 

* 19 quantiles 
mat 

q= (0. 05\0. 10\0.15\0. 20\0. 25\0. 30\0. 35\0. 40\0. 45\0. 50\0. 55\0. 60\ 
0.65\0.70\0.75\0.80\0.85\0. 90\0. 95) 

* reorganize matrix by variable 

forvalues j = l/'k 1 ( 
forvalues i = 1/19 ) 
local 1 = 'k 1 * ('i ' - 1) + ' j 1 

mat x 'j 'q 'i ' =q['i l], b['l 1], l['l 1], u['l 1], v[ ] l 1] 


forvalues j = l/'k ' j 
mat x 1 j ' = x ' j 'ql 
forvalues i = 2/19 ) 
mat x ■} =x]\x]qi 

i 

* q b 1 u v 

mat list x 1 j ', format( % 8. 3f) 
svwat x'j ' 

mat al = x 1 j 彳 [1 … ， 2] 
mat a2 = x 'jl[l … ， 5] 



mat xx 'j ' = q, al, a2 
* q b v 


mat list xx ' j ', format ( % 8. 3f) 
mat drop al a2 xx 1 j 1 

1 

* graphs using the same scale for categorical covariates 

* use age, age-squared and constant as examples 

* age 

twoway rarea xl3 xl4 xll, color(gsl4) | | line xl2 xll, lpattem( solid) 
yline(0, 

1 pattern (sol id) lwidth( inedthick)) ylabel ( 0 " 0 " 1 ” 1000” 2 "2000" 3 
"3000") 

ytitle(quantile coefficients for incane ( $) ) xtitle(p) xlabel(0(. 1) 1) 
legend (off ) 

graph export gO. ps, as(ps) logo(off) replace 

* age2 

twoway rarea x23 x24 x21, color(gsl4) || line x22 x21, lpattem(solid) 
yline(0. 

lstyle(foreground) lpattem(solid) lwidth(medthick)) xtitle(p) xlabel 
(0(.1)1) 
legend)off) 

graph export g2. ps, as(ps) logo)off) replace 

* constant (the typical setting) 

twoway rarea xl43 xl44 xl41, color (gsl4) | | line xl42 xl41, lpattem 
(solid) 
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yline(0, lstyle(foreground) lpattem(solid) lwidth(medthick)) ylabel 

(0(20)120) 

xlabel(0(. 1)1) xtitle(p) legendfoff) 
graph export gl4. ps, as(ps) logo (off) replace 


drop x* 

matrix drop 一 all 


第 4 步： 计算位置和形状变化 

* e0. do 

* full model 

* raw-scale income in $1000 

* bootstrap 

* analysis for 2001 

tempfile t 

global X age age2 blk hsp asn scl hsg nhs mh f h sg ot rural 

use cine SX year if year = 2 using do, clear 
drop year 

* centering covariates 
sum $X 

tokenize $X 
while 1 〜= I 

egen m = mean ('l ') 
replace 'l ' = 'l ' — ra 
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drop m 
macro shift 

I 

sum $X 
save 't' 

forvalues i = 1/500 | 
use 't clear 
bsample 

qreg cine SX, q(. 025) nolog 
rastore e, frora(e(b)) 
keep if _n<ll 
keep age 

save eO 'i 1 , replace 

i 

[修改 eO . do 中的命令从而生成分析第 0.5 分位数的 el . do 
和分析第 0. 975 分位数的 e 2. do ] 

* bsO.do 

* location and s^Bpe shift quantities 

* bootstrap confidence interval 

* 3 quantiles (.025, .5, .975) 

set raatsize 800 

* k = #of covariates + cons 


local k = 14 
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local kl = 'k ' — 1 

* initial 
forvalues j = 0/2 ( 
use e 'j 'l, clear 
qui rastore e 
mat ren e e ' j ' 

i 

forvalues j = 0/2 | 
forvalues i = 2/500 ) 
use e ] l , clear 
qui mstore e 
mat e 'j ' = e 'j '\e 
mat drop e 


forvalues j = 0/2 j 
qui svmat e 1 j ' 


* mean of estimate (point estimate) 

* percentile-method (95 % ci) 
forvhlues j = 0/2 | 
forvalues i = l/'k ') 

pctlle x= e 'j "i nq(40) 
sort x 

qui gen xO = x if _n = 20 
qui gen xl = x if —n = 1 



qui gen x2 = x if —n = 39 
egen em ' j "i 1 = max(xO) 
egen el 'j "i ' = raax(xl) 
egen eu ' j "i ' = raax(x2) 


drop x xo xl x2 

I . 11 . r -i I . 11 ■ I I . m . 

sum em j 1 el ] leu] 1 


* SCS scale shift 
forvalues i = l/'kl 1 ) 
gen scls ， i ， =: e2 ， i l -e0 ， i ， 
pctile x = scls 'i ', nq(40) 
sort x 

qui gen xO = x if _n = 20 
qui gen xl = x if _n = 1 
qui gen x2 = x if — n = 39 
egen seism 'i ' = raax(xO) 
egen sclsl 'i ' = niax(xl) 
egen selsu 1 i 1 = max(x2) 
drop x xO xl x2 

sum seism 'i 1 sclsl 'i 'selsu 'i 


* SKS skewedness shift 

* SKSe2(.975) - el(.5) andel(.5) - e0(.025) 

* i for covariate, k for constant 
forvalues i = l/'kl ' j 

gen nu = (e2 'i 1 + e2 'k ' - el. i ' - el 'k ' ) /(e2 'k ' - el ')c 1 ) 
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gen de = (el 'i 1 + el 'k ' - eO 'i ' - eO 'k ') /(el 'k ' - eO 'k ') 
gen skis 'i 1 = nu/de 
drop nu de 

petile x = skis 'i ', nq(40) 


sort x 

qui gen xO = x if _n = 20 
qui gen xl = x if _n = I 
qui gen x2. x if _n = 39 
egen sklsm 'i ' =raax(x0) 
egen ski si 'i ' = raax(xl) 
egen skleu 'i 1 = max(x2) 
drop x xo xl x2 

sum sklsm 'i 'sklsl 'i 'sklsu 'i 


I . 分析对数单位收入的 stata 命令 

[将初始单位收入替换为对数单位收入，重复第1、2、 3 步] 

第4 步： 基于对数收入 QRM 计算初始位置和形状变化 

[将 eO . do、el . do 和 e 2. do 文件中的初始单位收入替换为对 
数单位收入] 

set raatsize 800 

* k = # of covariates + cons 
local k = 14 
local kl = 'k ' - 1 


* parameter matrix (eO el e2) 
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* initial 
forvalues j = 0/2 | 
use e'j 'l, clear 
qui mstore e 
mat ren e e ' j 1 

I 

*■ 500 reps 
forvalues j = 0/2 j 
forvalues i = 2/500 j 
use e ] l , clear 
qu 丄 mstore e 
mat e ' j ' = e ' j '\e 
mat drop e 


get log conditional quantile 
forvalues j = 0/2 ( 

* dimensions 500 x 14 

* c ' j 'l to c ' j '13 are covariates 

* c 'j '14 constant 

forvalues m = l/'k 1 1 

mat c j m = e j [1 .. . , ml 

I 

forvalues m = l/〖kl 丨 | 

. i.M i I . 11 » - i.ii, I 

mat c ] m=c] ro+c] k 
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mat c ] = c j 1 
mat drop c 'j 'l 
forvalues ra = 2 /'k ' | 

. i. i I. I i.u I 

mat c ] = c ] » c j m 
mat drop c 1 j M m 1 

! 

* transform log-scale conditional quantile to raw-scale conditional 
quantile 

* matrix to var 
svmat c 1 j 1 

mat drop c 1 j 1 

forvalues m= l/'k 1 1 

qui replace c ] m = exp(c ] m ) 

I 

forvalues m = l/'kl '| 

. i 1. 11 I i.u i i. i h i 

mi replace c j m = c 3 ra - c ] k 

1 

* var to matrix 
forvalues m = l/'k 1 1 

rnkmat c 'j 1 'm 1 , raat(e 'j "in ') 


, I • ' I - u 

mat e ] = e j 1 



forvalues m = 2/'k 1 ( 

. t , I I . I I . I ! I 

mat e] = e ] ,e] m 
mat drop e ’j "ra ' 

I 

mstore e'j ', from(e 'j ') replace 

I 

mat dir 
keep age 
keep if _n<ll 
save 1-r, replace 


* bsl. do 

* bootstrap method 

* location and shape shift quantities 

* based on log-to-raw coeff 


set inatsize 800 

« k= # of covariates + cons 
local k = 14 
local kl = 'k ' - 1 

use 1 - r 


forvalues j = 0/2 J 
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qui rastore e 1 j 
qui svraat e j ' 


* mean of estimate (point estimate) 

* sd of estimates (se) 

* percentile-method (95 % ci) 
forvalues j = 0/2 | 
forvalues i = l/'k ' | 

pctile x = e ' j "i ', nq(40) 
sort x 

qui gen xO = x if - n =20 
qui gen xl = x if - n = 1 
qui gen x2 = x if - n = 39 
egen era ] i - max(xO) 
egen el 'j "i ' = max(xl) 
egen eu ' j "i ' = max(x2) 
drop x xo xl x2 

I , M , I , I . It , 1 I . 11. I 

sura on] lel] leu] i 


* scs scale shift 
forvalues i = l/'kl'( 
gen scls 'i ' = e2 'i 1 - eO 'i 
pctile x= scls 'i ', nq(40) 
sort x 

qui gen xO = x if - n =20 
qui gen xl = x if - n = 1 



qui gen x2 = x if - n = 39 
egen seism 1 i 1 = raax(xO) 
egen sclsl 'i ' = raax(xl) 
egen selsu 'i ' = raax(x2) 
drop x xo xl x2 

sum seism 'i 'sclsl 'i 'selsu 'i 


* SKS skewedness shift 

* SKS e2(.975) - el(.5) andel(.S) - e0(.025) 


* i for covsriate, k for constant 
forvalues i = l/'kl '| 

pen nu= (e2 'i ' + e2 'k ' - el 'i 1 - el 'k ')/(e2 'k ' - el 'k ') 
gen de = (el 'i 1 + el 'k ' - eO 'i r - eO 'k ') / (el 'k ' - eO 'kO) 
gen skis 'i ' = nu/de 
drop nu de 

petile x = skis 'i ', nq(40) 


sort x 

qai gen xO = x if - n = 20 
qui gen xl = x if -n=l 
qui gen x2 = x if - n = 39 
egen sklsm 'i ' = ntax(xO) 
egen sklsl 'i 1 = max(xl) 
egen sklsu *i ' - max(x2) 
drop x xo xl x2 

sum sklsm 'i 'sklsl 'i 'sklsu 'i 
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注释 

[1] 为了准确起见，我们假设样本大小是奇数。如果样本大小是偶数的，那 
么样本中位数则被定义为第 （ n /2) 位和第 (^- + 1) 位顺序统计值的 

平均值，在修改位于第 in/2) 位或第 ^ + 1) 位顺序统计值之上（或 

之下）的一个数据值同时保持它的相对位置不变时，这一表述依然 
正确。 

[2] 这里用到的数据来自收人与项目参与调查 (SIPP) 的 2001 年面板数据。 
家庭收人是指 2001 年的年收入。第 3 章至第 5 章中用到的分析样本 
包括 19390 户白人家庭和 3243 户黑人家庭。 

[ 3 ] Q 1 "' (y, | X,) = Q<" 十 + £ ； f> ) = 0 o f, + +Q-'U； > ) = 

Q … I i,.) +(> 卜 ” 

[4] 然而，不同分位数解决方法的数量受限于有限样本的大小。 

[5] 准确地说，百分比的变化是 100(， 11F ' —1) = 12.2 %。 

[6] 条件均值是与线性预测变量的指数形式成比例的 （ Manning ， 1998)。 
例如，如果误差服从正态分布 N(0, i )， 那么 E(y, I X,) - 

e °- 有时被称为拖尾因子 （smearing factor ) Q 

[7] 注意稳健性不适用于协变量的离群值。 

[ 8 ] 在 QRM 中，我们假设#的第々分位数等于0。 

[ 9 ] 参照/比较这对术语可见 Handcock Morris C 1999 ) c 

[10] 我们可以谈论增加一年教育的效应，而这对于所有种族和所有教育水 
平而言是一样的。相似的，从黑人变为白人也存在一种影响效应，对于 
所有教育水平来说也是相同的。这里存在黑人变为白人的效应，与白 
人变为黑人的效应相反。对没有交互项的 LRM 的位置效应的分析是 
十分简单的。当模型引人交互项时，这一分析便变得相当复杂。 

[11] 需要注意的是，我们可以指定任何分位数，例如第 a 39分位数，而不局 
限在等距分位数上。 

[12] 如果估计系数是那么预测变量的单位增量会使因变量增加 
[100(^ — 1)]%,对于估计系数3的小数值而言，这大概等于 100谷％。 

[13] 这些实践包括从 logit 、 probit 和 tobit 模型估计对概率的影响效应。 
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asymptotic inference 

渐近推断 

asymptotic procedure 

渐近程序 

average squared deviation 

均方差 

bootstrap method 

拔靴法 

bootstrap sample 

拔靴样本 

conditional mean 

条件平均数 

conditional median regression 

条件中位数回归 

conditional scale 

条件单位 

conditional-mean function 

条件均值函数 

conditional-mean modeling framework 

条件均值的建模框架 

conditional-mean models 

条件均值模型 

confidence envelope 

置信封闭间 

corresponding diagonal element 

相应对角元素 

derivative 

导数 

distributional interpretation 

分布理解 

empirical or sample cdf 

经验或样本分布函数 

exterior-point algorithms 

外点计算 

heteroscedastic error 

异方差误差模型 

inverse 

逆反函数 

in-sync 

同步模式 

least squares estimation 

最小二乘估计 

least-absolute-distance estimation 

最小绝对距离估计 

linear equivariance 

线性同变性 

mean absolute distance 

平均绝对距离 

mean effect, ME 

均值效应 

mean squared deviation 

均值平方差 

median regression 

中位数回归 

median-regression line 

中位数回归线 

minimum distance principle 

最小距离原则 

moment-based measure 

动差法 

monotone equi variance 

单调同变性 
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monotonic equivariance principle 

单调同变性 

multivariate normal approximation 

多变量正态近似法 

noncentral locations 

非中心位置 

one-model assumption 

单一模型假设 

out of sync 

不同步模式 

point/line duality 

点-线二元性 

polyhedral surface 

多面体曲面 

quantile-based measures 

分位差方法 

quantile-based procedures 

分位差程序 

quantile-based scale measure 

分位差刻度测量 

quantile-based skewness ( QSK) 

分位差偏态测量法 

quantile-based skewness 

分位差偏态 

quantile-regression model (QRM) 

分位数回归模型 

reference and comparison 

参考与比较 

sample points 

样本点 

sample quantiles 

样本分位数 

sampled distribution 

抽样分布 

scalar multiple 

纯量倍数 

scale and skewness 

刻度和偏态 

scale shift 

尺度变化 

skewness shift 

偏态变化 

smearing factor 

拖尾因子 

Studentized Range Test 

差距检定法 

the sum of absolute residuals 

绝对残差总和 

top-coded 

顶端编码 

typical-setting effects, TSE 

典型设定值 

upper spread 

上端部分 
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